1. 정의
- 두 개의 독립적인 모집단에 대한 평균에 통계적으로 유의한 차이가 있는지 검정
- 독립은 양 집단의 양적 자료 간에 영향을 주지 않는 상태
정규성 가정이 만족되거나 표본의 크기가 큰 경우 독립표본 T 검정
정규성 가정이 깨지고 표본의 크기가 작으면 윌콕슨의 순위합 검정
2. Independent two samples test road map
3. 정규성 검정
- 독립된 집단 두 개이기 때문에 정규성 과정 두 번 실시
4. 등분산 검정(Equality of Variance Test)
1) 정의
- 두 개 이상의 그룹의 분산 또는 표준 편차가 서로 다른지 여부 확인
2) 방법
(1) 가설
- 귀무가설 : 등분산이다.
- 대립가설 : 이분산이다.
(2) Code
stats.levene(data1, data2)
stats.bartlett(data1, data2)
- 결론 : 유의확률이 0.000이므로 유의수준 0.05에서 이분산이다.
Levene vs. Bartlett
: Bartlett 검정은 정규성 가정이 만족한 집단들에 대한 등분산 검정
: Levene 검정은 정규성 유무에 관계없이 등분산 검정 가능
5. 독립 2표본 T검정
1) 방법
(1) 가설
- 귀무가설 : ~와 ~은 같다.
- 대립가설 : ~와 ~은 같지 않다.
(2) Code
stats.ttest_ind(data1, data2, equal_var = True or False)
6. Wilcoxon's rank sum test
1) 방법
(1) 가설
- 귀무가설 : ~와 ~은 같다.
- 대립가설 : ~이 ~보다 작다.
(2) Code
stats.ranksums(data1, data2)
- 결론 : 유의확률 0.000(python의 p-value) / 2 = 0.000 이므로 유의수준 0.05에서 A의 가격이 B의 가격보다 통계적으로 유의하게 작은 것으로 나타났다.