독립표본 T-검정

코딩다시시작·2024년 10월 22일

python t-검정 빅데이터분석기사 퇴근후딴짓

빅데이터분석

목록 보기

8/19

독립표본 t-검정

주요 개념

1. 독립된 두 표본

독립표본 t-검정에서 가장 중요한 가정은 두 표본이 서로 독립적

2. 정규성 가정

두 그룹의 데이터가 정규분포를 따른다는 가정

3. 등분산성 가정

두 그룹의 분산이 동일 하다는 가정

4. 귀무가설, 대립가설

귀무가설(H0): 두 그룹의 평균 차이가 없다 (동일한 모집단)
대립가설(H1): 두 그룹의 평균에 유의미한 차이가 있다

t-검정 공식

X1, X2: 두 그룹의 평균
s1^2, s2^2: 두 그룹의 분산
n1, n2: 두 그룹의 표본 크기

t-값을 기반으로 p-값을 계산하고 p-값이 유의수준 보다 작으면 귀무가설을 기각하고 대립가설을 채택

문제풀기

문제

어떤 특정 약물을 복용한 사람들의 평균 체온이 복용하지 않은 사람들의 평균 체온과 유의미하게 다른지 검정해보려고 합니다.

가정:

약물을 복용한 그룹과 복용하지 않은 그룹의 체온 데이터가 각각 주어져 있다고 가정합니다.
각 그룹의 체온은 정규분포를 따른다고 가정합니다.

문제 풀기

가정

가정1: 독립된 두 표본
가정2: 정규성 가정

코드

from scipy import stats

# 데이터 수집
group1 = [36.8, 36.7, 37.1, 36.9, 37.2, 36.8, 36.9, 37.1, 36.7, 37.1]
group2 = [36.5, 36.6, 36.3, 36.6, 36.9, 36.7, 36.7, 36.8, 36.5, 36.7]

# 가설 설정
H0 = "약물을 복용한 그룹과 복용하지 않은 그룹의 평균 체온은 유의미한 차이가 없다."
H1 = "약물을 복용한 그룹과 복용하지 않은 그룹의 평균 체온은 유의미한 차이가 있다."

# 가설검정
t, p = stats.ttest_ind(group1, group2)

a = 0.05

if p < a:
    print("귀무가설을 기각합니다. " + H1)
else:
    print("귀무 가설을 채택합니다. " + H0)