[Data Analysis] 9. 독립 2표본 검정 (Independent two samples test)

Fly High!·2020년 8월 23일
0

Data Analysis

목록 보기
9/17
post-thumbnail

1. 정의

  • 두 개의 독립적인 모집단에 대한 평균에 통계적으로 유의한 차이가 있는지 검정
  • 독립은 양 집단의 양적 자료 간에 영향을 주지 않는 상태

    정규성 가정이 만족되거나 표본의 크기가 큰 경우 독립표본 T 검정
    정규성 가정이 깨지고 표본의 크기가 작으면 윌콕슨의 순위합 검정

2. Independent two samples test road map

3. 정규성 검정

  • 독립된 집단 두 개이기 때문에 정규성 과정 두 번 실시

4. 등분산 검정(Equality of Variance Test)

1) 정의

  • 두 개 이상의 그룹의 분산 또는 표준 편차가 서로 다른지 여부 확인

2) 방법

(1) 가설

  • 귀무가설 : 등분산이다.
  • 대립가설 : 이분산이다.

(2) Code

# Levene Test
stats.levene(data1, data2)
# Bartlett Test
stats.bartlett(data1, data2)

  • 결론 : 유의확률이 0.000이므로 유의수준 0.05에서 이분산이다.

    Levene vs. Bartlett
    : Bartlett 검정은 정규성 가정이 만족한 집단들에 대한 등분산 검정
    : Levene 검정은 정규성 유무에 관계없이 등분산 검정 가능

5. 독립 2표본 T검정

1) 방법

(1) 가설

  • 귀무가설 : ~와 ~은 같다.
  • 대립가설 : ~와 ~은 같지 않다.

(2) Code

stats.ttest_ind(data1, data2, equal_var = True or False)
# True  : 등분산
# False : 이분산
# equal_var : equality of variance

6. Wilcoxon's rank sum test

1) 방법

(1) 가설

  • 귀무가설 : ~와 ~은 같다.
  • 대립가설 : ~이 ~보다 작다.

(2) Code

stats.ranksums(data1, data2)

  • 결론 : 유의확률 0.000(python의 p-value) / 2 = 0.000 이므로 유의수준 0.05에서 A의 가격이 B의 가격보다 통계적으로 유의하게 작은 것으로 나타났다.
profile
Back-end, Python, Data

0개의 댓글