독립표본 T-검정 (Independent Samples T-test)

data-yeon·2025년 3월 2일

Data Science

목록 보기
9/10
  1. 정의

독립표본 T-검정(Independent Samples T-test)은 두 개의 독립된 집단 간 평균 차이가 통계적으로 유의한지를 검정하는 방법이다. 즉, 두 그룹의 평균이 동일한 모집단에서 나왔는지 여부를 확인하는 데 사용된다.

  1. 가정 (Assumptions)

독립표본 T-검정을 수행하기 위해 다음과 같은 가정이 충족되어야 한다.
1. 독립성: 두 집단의 데이터가 서로 독립적이어야 한다.
2. 정규성: 각 집단의 데이터가 정규분포를 따라야 한다. (샘플 크기가 충분히 크다면 중심극한정리에 의해 완화될 수 있음)
3. 등분산성: 두 집단의 분산이 동일해야 한다. (Levene’s test를 통해 확인 가능)

  1. 검정 가설 (Hypothesis Testing)
    • 귀무가설 (H)(H₀): 두 집단의 평균이 동일하다. (μ1=μ2)(\mu_1 = \mu_2)
    • 대립가설 (H)(H₁): 두 집단의 평균이 다르다. (μ1μ2)(\mu_1 \neq \mu_2)

  2. T-통계량 (Test Statistic) 계산

두 집단의 평균이 같다는 귀무가설 하에서 검정 통계량 tt 는 다음과 같이 계산된다.

t=Xˉ1Xˉ2s12n1+s22n2t = \frac{\bar{X}_1 - \bar{X}_2}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}}

  • Xˉ1,Xˉ2\bar{X}_1, \bar{X}_2 : 두 집단의 표본 평균
  • s12,s22s_1^2, s_2^2 : 두 집단의 표본 분산
  • n1,n2n_1, n_2 : 각 집단의 표본 크기
  1. 검정 결과 해석
    • p-value < 유의수준(α) → 귀무가설 기각 → 두 집단의 평균이 통계적으로 유의하게 다르다.
    • p-value ≥ 유의수준(α) → 귀무가설 채택 → 두 집단의 평균 차이가 통계적으로 유의하지 않다.


    Python 코드 예제: 독립표본 T-검정 수행

    import numpy as np
    import scipy.stats as stats
    
    # 두 그룹의 샘플 데이터 생성
    group1 = np.random.normal(loc=50, scale=10, size=30)  # 평균 50, 표준편차 10, 30개 샘플
    group2 = np.random.normal(loc=55, scale=10, size=30)  # 평균 55, 표준편차 10, 30개 샘플
    
    # 독립표본 T-검정 수행
    t_stat, p_value = stats.ttest_ind(group1, group2, equal_var=True)  # 등분산 가정
    
    print(f"T-statistic: {t_stat:.4f}")
    print(f"P-value: {p_value:.4f}")
    
    # 결과 해석
    alpha = 0.05
    if p_value < alpha:
        print("귀무가설 기각: 두 그룹의 평균은 유의미하게 다르다.")
    else:
        print("귀무가설 채택: 두 그룹의 평균 차이는 유의하지 않다.")
profile
잘 갔다 오란다고 잘 갔다 올 수 있는 곳이 아니야

0개의 댓글