T-Test(t검정)은 통계에서 정말 자주 쓰는 핵심 개념이다. 오늘은 T-test에 대해서 자세하지만 간단하게 배워볼 것이다.
두 그룹간 평균의 차이가 “우연인지”, “진짜인지” 를 검정하는 통계방법
예를 들어 A반의 성적이 B반의 성적보다 높은지 알고 싶을 때,
A반에서 10명, B반에서 10명을 뽑아 평균을 확인했더니 A반의 평균이 약 3점 정도 높았다.
그러나 A반에서 뽑은 10명과 B반에서 뽑은 10명이 실제로 A반과 B반을 대표하는 학생들일지는 모른다. (B반에서 뽑은 10명의 학생이 우연의 일치로 하위권 학생들일 수 있다.)
그래서 우리는, A반의 10명이 B반의 10명보다 성적이 높은 것이 우연인지, 진짜인지를 알고 싶은거다.
이런 상황에서 우리는 T-Test를 사용한다.
그럼 t값은 어떻게 구할 수 있을까?
그리고 이 t값으로 우리는 p-value(유의확률)을 구한다.
T-Test 종류에는 3가지가 있다. 상황에 따라 사용하는 T-Test가 다르니 알고 있도록 하자.
독립표본 t-test
서로 다른 집단의 평균 비교
대응표본 t-test
같은 그룹을 전(before)과 후(after)로 비교
단일표본 t-test
하나의 집단 평균이 어떤 기준값(특정값)과 다른지 검정
이제 어떤 상황에서 t-test를 쓰는지, t값이 어떻게 변화하는지도 알았다.
하지만 가장 중요한 것은 t-test 결과를 어떻게 해석할 것인가?
일반적으로 기준은
p-value < 0.05면
→ 두 집단 간의 평균 차이가 통계적으로 유의하다.
p-value > 0.05면
→ 두 집단 간의 평균 차이는 우연이다.(평균차이는 유의하지 않다)
즉, p가 작을수록 두 그룹 간 평균 차이가 “실제로” 있을 확률이 올라가고,
p가 커질수록 두 그룹 간 평균 차이가 “우연히” 존재했을 확률이 올라간다.
✅ 그러나 !!
t-test는 효과의 크기를 말해주지 않는다.
즉, 얼마나 큰 차이가 나는지, 실제로 임상적으로 의미있는 차이인지는 말해주지 않는다.
단순히 t-test에서는
만 알 수 있다.