
t-test는 통계적 가설 검정을 할 때 사용하는 방법 중 하나이며 모집단을 대표하는 표본으로부터 추정된 분산이나 표준편차를 가지고 검정하는 방법이다. 집단간 평균차이를 분석 할 때 쓰인다.
t-test에 대해서 설명하기 위해서는 t-test를 언제 사용하는지를 알아야 한다. t-test를 설명하기 이전에 적합한 검정방법을 찾는 방법을 알아보자.
적합한 가설 검정 방법을 알기 위해서는 다음과 같은 것들을 고려해야 한다.
1) 수치로 표현되는 양적변수(quantitative variable)인가?
2) 그룹으로 구분되어 측정되는 범주형 변수(categorical variable)인가?
양적변수의 경우에는 변수의 성질도 함께 고려해야 한다. 왜냐하면 이것이 검정의 기본 가정이 되기 때문이다. 따라서 양적변수가 어떤 분산을 따르는지도 검정해야 한다.
1) 정규성 가정: "모집단이 정규분포를 따른다"
-정규성을 따르는지를 판단하는 검정으로는 샤피로-윌크 검정, 콜모고르프-스미르토노프 검정, Q-Q 플롯 등이 있다.
2) 등분산성 가정: "집단 간 분산이 동일하다"
-등분산을 따르는지 조사하는 방법으로는 레빈 검정과 바틀렛 검정이 있다.
모평균에 대한 검정의 종류를 나누어보면 다음과 같은 표로 표현해볼 수 있다.

즉, t-test는 모집단이 정규분포를 따르는데 모분산을 모르는 경우 사용한다.
t-test의 종류는 아래와 같다.
: 두 집단이 독립적인(서로 관계가 없는) 경우
e.g. 두 집단을 두고 신약을 복용한 그룹과 복용하지 않은 그룹의 평균 혈압 비교
1) 등분산성 가정(두 집단의 모분산이 같다고 가정하는 경우)
: 스튜던트 t 검정
2) 두 집단의 모분산이 다르다고 가정하는 경우
: 웰치의 t 검정
: 두 집단이 밀접한 관련성을 갖는 경우
e.g. 신약 투약 전후 비교
t-test의 검정통계량은 t값을 구하는 식으로 계산을 해주게 된다.
t-test의 식을 이해하는 부분이 까다로운데, 우선 t-test의 검정통계량 계산식은 아래와 같다. (사실 아직도 이해중이다. 조사하는대로 추가적인 정보를 붙여넣어두겠다.)

공돌이의 수학정리노트(2020.02.13). "t-value의 의미와 스튜던트의 T 테스트"
게으름의 흔적(2022.01.05) "t값 보고 p값 계산하는 법"
의미를 이해하는 통계학과 데이터 분석(2022.04.21). "t-test 밑바닥부터 이해하기"
코드잇 데이터 애널리스트 강의노트
행복한엄쌤(2018.08.05). "[통계교육] 풀어쓰는 통계-t 검정(t-test)이란?
1) 가설 설정
귀무가설(H0): 두 집단의 평균에 차이가 ㅇ벗다.
대립가설(H1): 두 집단의 평균에 차이가 있다.
2) 유의수준 설정
일반적으로 0.05
3) 검정 통계량 계산
t-test 유형에 따라 검정 통계량 계산
4) p-value를 계한
검정 통계량을 이용해 p-value 계산
5) 결정 및 해석