스튜던트의 t 분포

Kiwoong Park·2022년 2월 8일
0

💡 student t-distribution

t 분포는 정규분포와 비슷하지만, 꼬리 부분이 약간 두껍고 길다. 이것은 표본통계량의 분포를 설명하는 데 광범위하게 사용된다. 표본평균의 분포는 일반적으로 t 분포와 같은 모양이며, 표본 크기에 따라 다른 계열의 t 분포가 있다. 표본이 클수록 더 정규분포를 닮은 t 분포가 형성된다.

1908년 윌리엄 고셋이 "Biometrika"에 '학생(Student)'이라는 필명으로 논문을 발표하는 바람에, 종종 스튜던트의 t 분포라고 불린다. 고셋이 근무하던 기네스는 자신들이 통계 방법을 사용한다는 사실을 경쟁 업체에 알리고 싶지 않았고, 그래서 고셋은 이 논문에 자신의 이름을 사용하지 못했다.

표준화된 여러 통계 자료를 t 분포와 비교하여 신뢰구간을 추정할 수 있다. 표본평균이 x인, 크기 n의 표본이 있다고 가정하자. s가 표본 표준편차라면, 표본평균 주위의 90% 신뢰구간은 아래와 같이 주어진다.
xˉ±tn1(.05)xsn\bar{x}\pm t_{n-1}(.05)x\cfrac{s}{\sqrt n}, tn1t_{n-1}은 t 분포의 양쪽 끝에서 5%를 잘라내는 t 통계량

표본평균, 두 표본평균 간의 차이, 회귀 파라미터, 그 외 다른 통계량들의 분포를 구할 때 t 분포를 사용한다.

현재와 같은 성능의 컴퓨터가 1908년부터 널리 사용되었다면, 처음부터 통계학은 계산을 많이 필요로 하는 재표본추출 방법(Ex. 부트스트랩)을 훨씬 많이 이용했을지도 모른다. 이 시기에 통계학자들은 표본분포를 근사화하기 위한 수학적 기법과 t 분포와 같은 함수로 다루는 것에 집중했다.

profile
You matter, never give up

0개의 댓글