tak's data blog
python 카이제곱검정 본문
반응형
SMALL
카이제곱 검정/적합도 검정(Goodness of Fit Test)
- 관측도수와 기대도수에 따른 비율차이가 통계적으로 유의한가?
# 매치결과(승,무,패)에 따른 이탈여부
X= pd.crosstab(nextfield7.churn, nextfield7.matchResult)
X
Ob = X.values[1,:]
Pr = np.array([0.3,0.3,0.4])
n = X.values[1,2]
E = n*Pr
stats.chisquare(Ob, E)
Power_divergenceResult(statistic=272.4761904761905, pvalue=6.800596585853635e-60)
# 모집단에 알려진 기대도수가 실제관측도수에 따른 비율과 통계적으로 유의한 차이가 있는가?
# 관측도수와 기대도수에 따른 비율차이는 통계적으로 유의하다.
카이제곱 검정/독립성 검정
- 두 변수가 통계적으로 연관성이 있는가?
X= pd.crosstab(nextfield7.churn, nextfield7.matchResult, margins=False)
X
stats.chi2_contingency(X)
(1.6826468781271031,
0.4311395587600372,
2,
array([[158.47674419, 264.12790698, 285.39534884],
[ 72.52325581, 120.87209302, 130.60465116]]))
# 2번째 줄이 유의확률 0.431
# 즉, 독립이라고 볼 수 있다.
카이제곱 검정/동질성 검정
- 두 표본이 있다고 할 때 두 표본의 비율차이가 통계적으로 유의하다고 볼 수 있는가?
반응형
LIST
'통계 관련' 카테고리의 다른 글
분산분석(ANOVA) - 피파4 공식경기등급에 따른 패스스탯차이 (0) | 2022.10.04 |
---|---|
간단한 통계 개념 복습-2 (2) | 2022.09.16 |
python t검정 (0) | 2022.09.15 |
간단한 통계 개념 복습-1 (2) | 2022.09.15 |