T-Test

Minjung·2025년 11월 17일

T-Test(t검정)은 통계에서 정말 자주 쓰는 핵심 개념이다. 오늘은 T-test에 대해서 자세하지만 간단하게 배워볼 것이다.

T-Test란?

💡

두 그룹간 평균의 차이가 “우연인지”, “진짜인지” 를 검정하는 통계방법

예시

예를 들어 A반의 성적이 B반의 성적보다 높은지 알고 싶을 때,

A반에서 10명, B반에서 10명을 뽑아 평균을 확인했더니 A반의 평균이 약 3점 정도 높았다.

그러나 A반에서 뽑은 10명과 B반에서 뽑은 10명이 실제로 A반과 B반을 대표하는 학생들일지는 모른다. (B반에서 뽑은 10명의 학생이 우연의 일치로 하위권 학생들일 수 있다.)

그래서 우리는, A반의 10명이 B반의 10명보다 성적이 높은 것이 우연인지, 진짜인지를 알고 싶은거다.

이런 상황에서 우리는 T-Test를 사용한다.

t값 = (두 평균의 차이) / (차이가 우연일 가능성을 반영한 반등성)

그럼 t값은 어떻게 구할 수 있을까?

  1. 평균 차이가 크면 t값이 커지고
  2. 표준편차가 크면 t값이 줄어들고
  3. 샘플 개수가 많아지면 t값이 커진다.(정확해진다)

그리고 이 t값으로 우리는 p-value(유의확률)을 구한다.

T-Test 종류

T-Test 종류에는 3가지가 있다. 상황에 따라 사용하는 T-Test가 다르니 알고 있도록 하자.

  1. 독립표본 t-test

    서로 다른 집단의 평균 비교

    • A반vsB반
    • 여자vs남자
    • 등등..
  2. 대응표본 t-test

    같은 그룹을 전(before)과 후(after)로 비교

    • 다이어트 시작 전 vs 다이어트 시작 후
    • B반의 중간고사 성적 vs B반의 기말고사 성적
  3. 단일표본 t-test

    하나의 집단 평균이 어떤 기준값(특정값)과 다른지 검정

    • A반의 평균 성적이 80점(기준값)이 넘는지 확인
    • 한 학교의 평균 키가 165cm가 넘는지 확인

해석

이제 어떤 상황에서 t-test를 쓰는지, t값이 어떻게 변화하는지도 알았다.

하지만 가장 중요한 것은 t-test 결과를 어떻게 해석할 것인가?

일반적으로 기준은

p-value < 0.05면

→ 두 집단 간의 평균 차이가 통계적으로 유의하다.

p-value > 0.05면

→ 두 집단 간의 평균 차이는 우연이다.(평균차이는 유의하지 않다)

즉, p가 작을수록 두 그룹 간 평균 차이가 “실제로” 있을 확률이 올라가고,

p가 커질수록 두 그룹 간 평균 차이가 “우연히” 존재했을 확률이 올라간다.

✅ 그러나 !!

t-test는 효과의 크기를 말해주지 않는다.

즉, 얼마나 큰 차이가 나는지, 실제로 임상적으로 의미있는 차이인지는 말해주지 않는다.

단순히 t-test에서는

  • 두 그룹간의 평균 차이가 존재하는지
  • 그 차이가 우연인건지
  • 어느 그룹이 높은지

만 알 수 있다.

profile
취준하는 데이터 분석가의 정리노트📘

0개의 댓글