2.10 카이제곱분포
1. 카이제곱통계량 이란?
- 검정 결과가 독립성에 대한 귀무 기댓값에서 벗어난 정도를 측정하는 통계량
- 관측 데이터가 특정 분포에 '적합'한 정도를 나타낸다.
2. 카이제곱 식
- 관측값과 기댓값의 차이를 기댓값의 제곱근으로 나눈 값을 다시 제곱하고 모든 범주에 대해 합산한 값
[출처: https://bioinformaticsandme.tistory.com]
3. 카이제곱 활용
- 여러 처리('A/B/C ~ 검정')의 효과가 서로 다른지 여부 결정
- 카이제곱이 낮다 = 기대 분포를 거의 따르고 있다
- 카이제곱이 높다 = 기대한 것과 현저하게 다르다
피터 브루스, 앤드루 브루스의 <데이터 과학을 위한 통계(2판): 데이터 분석에서 머신러닝까지 50가지 핵심 개념> 을 읽고 정리한 내용입니다.