tak's data blog

python 카이제곱검정 본문

통계 관련

python 카이제곱검정

hyuntaek 2022. 9. 16. 14:18
반응형
SMALL

 

 

카이제곱 검정/적합도 검정(Goodness of Fit Test)
- 관측도수와 기대도수에 따른 비율차이가 통계적으로 유의한가?

# 매치결과(승,무,패)에 따른 이탈여부
X= pd.crosstab(nextfield7.churn, nextfield7.matchResult)
X



Ob = X.values[1,:]
Pr = np.array([0.3,0.3,0.4])
n = X.values[1,2]
E = n*Pr
stats.chisquare(Ob, E)

Power_divergenceResult(statistic=272.4761904761905, pvalue=6.800596585853635e-60)
# 모집단에 알려진 기대도수가 실제관측도수에 따른 비율과 통계적으로 유의한 차이가 있는가?
# 관측도수와 기대도수에 따른 비율차이는 통계적으로 유의하다.

 

 

 

카이제곱 검정/독립성 검정
- 두 변수가 통계적으로 연관성이 있는가?

X= pd.crosstab(nextfield7.churn, nextfield7.matchResult, margins=False)
X

stats.chi2_contingency(X)

(1.6826468781271031,
 0.4311395587600372,
 2,
 array([[158.47674419, 264.12790698, 285.39534884],
        [ 72.52325581, 120.87209302, 130.60465116]]))
        
        
# 2번째 줄이 유의확률 0.431
# 즉, 독립이라고 볼 수 있다.

 

 

카이제곱 검정/동질성 검정
- 두 표본이 있다고 할 때 두 표본의 비율차이가 통계적으로 유의하다고 볼 수 있는가?

 

 

 

 

반응형
LIST