[세상에서 가장 쉬운 통계학 입문] 을 읽고 -카이제곱분포
카이제곱분포
: 표본분산을 구하는 방법과 카이제곱분포
1.표본분산을 구하는 방법
- 표본분산이란
관특 데이터(표본)으로 계산한 분산
- 표본분산을 구하는 단계
1.표본평균을 계산
2.각 표본에서 표본평균을 빼 편차를 구한다.
3.각 편차를 제곱해서 모두 더하고, 표본 총 개수로 나누어 계산한다.
=>이렇게 계산된 표본분산은 이라는 기호로 나타낸다.
- 표본분산도 모분산을 반영하는 분포가 되지만, 정규분포가 아니다.
=>제곱을 해서 합하기 때문에 표본분산은 결코 음수가 되지 않는다.2.카이제곱분포란?
- (자유도 n인 카이제곱분포를 하는 V)
표준정규모집단에서 n개의 표본인 x1+x2+--를 제곱하고 모두 합하여
V=+++++ 과 같은 통계량 V를 구하면,
V는 자유도 n인 카이제곱분포를 한다.=> 카이제곱분포를 하는 V는 0 이상의 값밖에 나오지 않는다.
또한 0에 가까운 수치의 상대도수가 크고,0에서 떨어진 수치의 상대도수는 급격히 작아짐
- 카이제곱분포의 특징
1. 0 근처의 데이터 상대도수가 크다
=>즉, 히스토그램이 청룡열차 형태
=> 정규분포가 0근처 수치의 상대도수가 크다는 것을 반영
2. 자유도 n이 커짐에 따라서 가운데 볼록한 높이가 낮아지면서 점점 오른쪽으로 치우침
=>경사가 완만해진다.
=>n이 커지면서 0에서 조금 떨어진 데이터가 나오는 상대도수가 높아져 가는 것을 의미