대부분의 경우 정규분포의 z-test 와 t-test를 단순/별도로 설명하지만 연결해서 볼 필요가 있다.
본질적으로는 같기 때문!
모집단 <- z-test
표본(샘플) <- t-test
우리는 모집단을 가지고 테스트를 할 수가 없다.(거의 없다본다. 인구 전체를 어떻게함..?)
무한 개수의 정규분포 곡선을 적분하는 번거로움을 덜기 위해.
표준정규분포 = 평균(μ)이 "0"이고, 표준편차(σ)가 "1"인 정규분포
어떻게 이용할까?
Q. 이때 82점부터 90점까지의 점수를 받은 학생 수는?
위 면적을 적분한다 ? ??
불가!
-> 1. 정규분포를 표준정규분포로 바꾼다. Z(82) z-score = 0 / Z(90) z-score = 1.6
'표준정규분포표'라는 확률표를 만들어뒀음 z-score = 1.6 > 0.9452
0 <= z-score <= 1.6 사이의 값이므로 0.9452 - 0.5 = 0.4452
0.4452 * 1000 = 약 445명
z-test는 z값과 표준정규분포표를 이용해서 진행
z-score(z값)으로 변환하는 것을 z-transformation or standardization(표준화)라고 함.
z값은 단위로부터 자유롭다.
z-score = (X - μ) / σ
1 표준편차당 관찰값(X)가 평균으로부터 얼마나 떨어져있는가를 의미
정규분포곡선의 아래 면적이 확률
-> 어떤 사건이 우연히 발생할 확률이 얼마일까?
-> 여기서 말하는 확률이 정규분포곡선 아래 면적인 그 확률과 같다.
다만 t-test를 할 때는 정규분포를 쓰지 않고 다른 분포 곡선을 사용.