주어진 상황에 대해서, 하고자 하는 주장이 맞는지 아닌지를 판단하는 과정
t-test는 3가지 조건이 가정되어야 한다
1가지의 sample 값들의 평균이 특정값과 동일한지 비교
from scipy import stats
stats.ttest_1samp(샘플 데이터프레임, 비교하려는 값)
Ttest_1sampResult(statistic=0.5690174909554405, pvalue=0.5694721717152109)
ex) pvalue 0.56정도의 확률로 ‘샘플의 평균값’이 ‘비교하려는 값’과 같다
pvalue가 (1 – confidence) 보다 낮은 경우, 귀무가설을 기각하고 대안가설을 채택
→ 귀무가설이 틀렸고 대안가설이 맞다 정도의 느낌
2개의 샘플 값들의 평균이 서로 같은지 다른지를 비교
ex) 귀무가설 : 같다 / 대안가설 : 같지 않다
from scipy import stats
stats.ttest_ind(샘플1, 샘플2)
alternative 옵션 ‘less’ / ‘greater’ (단측검정)
(기본적으로는 'two-sided' 양측검정)
(실행 전 업데이트를 해야한다 !pip install scipy --upgrade)
ex) A = [100, 100, 100] B = [0, 0, 0]
stats.ttest_ind(A, B, alternative = ‘less’).pvalue 1.0
A의 평균을 기준으로 B의 평균이 작을 확률이 1.0이다
stats.ttest_ind(A, B, alternative = ‘greater’).pvalue 0.0
A의 평균을 기준으로 B의 평균이 클 확률이 0.0이다