독립표본 T-검정 (Independent Samples T-test)

data-yeon·2025년 3월 2일

목록 보기

9/10

정의

독립표본 T-검정(Independent Samples T-test)은 두 개의 독립된 집단 간 평균 차이가 통계적으로 유의한지를 검정하는 방법이다. 즉, 두 그룹의 평균이 동일한 모집단에서 나왔는지 여부를 확인하는 데 사용된다.

가정 (Assumptions)

독립표본 T-검정을 수행하기 위해 다음과 같은 가정이 충족되어야 한다.
1. 독립성: 두 집단의 데이터가 서로 독립적이어야 한다.
2. 정규성: 각 집단의 데이터가 정규분포를 따라야 한다. (샘플 크기가 충분히 크다면 중심극한정리에 의해 완화될 수 있음)
3. 등분산성: 두 집단의 분산이 동일해야 한다. (Levene’s test를 통해 확인 가능)

검정 가설 (Hypothesis Testing)
• 귀무가설 $(H₀)$ : 두 집단의 평균이 동일하다. $(\mu_1 = \mu_2)$
• 대립가설 $(H₁)$ : 두 집단의 평균이 다르다. $(\mu_1 \neq \mu_2)$
T-통계량 (Test Statistic) 계산

두 집단의 평균이 같다는 귀무가설 하에서 검정 통계량 $t$ 는 다음과 같이 계산된다.

$t = \frac{\bar{X}_1 - \bar{X}_2}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}}$

$\bar{X}_1, \bar{X}_2$ : 두 집단의 표본 평균
$s_1^2, s_2^2$ : 두 집단의 표본 분산
$n_1, n_2$ : 각 집단의 표본 크기

검정 결과 해석
• p-value < 유의수준(α) → 귀무가설 기각 → 두 집단의 평균이 통계적으로 유의하게 다르다.
• p-value ≥ 유의수준(α) → 귀무가설 채택 → 두 집단의 평균 차이가 통계적으로 유의하지 않다.

Python 코드 예제: 독립표본 T-검정 수행

import numpy as np
import scipy.stats as stats

# 두 그룹의 샘플 데이터 생성
group1 = np.random.normal(loc=50, scale=10, size=30)  # 평균 50, 표준편차 10, 30개 샘플
group2 = np.random.normal(loc=55, scale=10, size=30)  # 평균 55, 표준편차 10, 30개 샘플

# 독립표본 T-검정 수행
t_stat, p_value = stats.ttest_ind(group1, group2, equal_var=True)  # 등분산 가정

print(f"T-statistic: {t_stat:.4f}")
print(f"P-value: {p_value:.4f}")

# 결과 해석
alpha = 0.05
if p_value < alpha:
    print("귀무가설 기각: 두 그룹의 평균은 유의미하게 다르다.")
else:
    print("귀무가설 채택: 두 그룹의 평균 차이는 유의하지 않다.")

data-yeon

잘 갔다 오란다고 잘 갔다 올 수 있는 곳이 아니야

이전 포스트

다중공선성 (Multicollinearity)

다음 포스트

독립표본 T-검정 (Independent Samples T-test)

Data Science

다중공선성 (Multicollinearity)

카이제곱 검정 (Chi-Square Test)

0개의 댓글