3.9 카이제곱검정
1. 용어 정리
- 카이제곱통계량(chi-square statistic): 기댓값으로부터 어떤 관찰값까지의 거리를 나타내는 측정치
- 기댓값(expectation): 어떤 가정으로부터 데이터가 발생할 때, 그에 대해 기대하는 정도
- d.f.(degrees od freedom): 자유도
3.9.1 카이제곱검정: 재표본추출 방법
1. 수식
-
피어슨 잔차
-
카이제곱통계량
3.9.2 카이제곱검정: 통계적 이론
- 적절한 카이제곱 분포는 자유도에 의해 결정 된다.
- 다양한 자유도에 따른 카이제곱 분포
3.9.3 피셔의 정확검정
주요 개념
- 통계학에서 흔한 정차는 관측된 데이터가 독립성 가정을 따르는지 검증하는 것이다.
- 카이제곱분포는 카이제곱통계량을 비교할 기준분포이다.
피터 브루스, 앤드루 브루스의 <데이터 과학을 위한 통계(2판): 데이터 분석에서 머신러닝까지 50가지 핵심 개념> 을 읽고 정리한 내용입니다.