기초통계 (25) 카이제곱검정과 피셔의 정확성검정

생각하는 마리오네트·2021년 10월 11일
0

통계

목록 보기
30/41

📈 카이제곱검정

  • 카이제곱검정(chi-square test)은 주로 횟수 관련 데이터 사용되며 예상되는 분포에 얼마나 잘 맞는지를 검정한다.
  • 변수간에 독립성에 대한 귀무가설이 타당한지를 평가하기 위해 r x c 분할표를 함께 사용한다

📈 용어정리

  • 카이제곱통계량 : 기댓값으로부터 어떤 관찰값까지의 거리를 나타내는 측정치
  • 기대값(expectation(expected)) : 어떤 가정(보통 귀무가설)으로부터 발생할 때, 그에 대해 기대하는 정도
  • d.f.(degrees of freedom) : 자유도

피셔의 정확성 검정

데이터과학과의 관련성

카이제곱 검정이나 피셔의 정확성검정은 특정 효과가 실제로 영향을 미치는지 우연인지 알고 싶을 때 사용하는 것이다. 고전 통계에서는 통게적 유의성을 결정하는 것이지만 데이터과학자 에게는 최적의 처리방법을 찾는것이 목표이므로 오히려 MAB(Multi Armed Bandit)알고리즘이 더 정확한 해결책일 것이다..

피셔의 정확성검정을 활용하는 대표적인 예를 들어보면, 웹실험에서 적합한(충분한?) 표본크기를 판별하는 일이 들 수 있다. 클릭률을 예로들때 수천 번의 실험을 했지만 집게비율이 너무 낮아 해당 실험만을 가지고 확실한 결론을 내리기 힘든경우 피셔의 정확성 검정을 사용하는데 이때 우리는 "피셔의 정확성 검정을 사용해야지" 라는 접근이 아니라 "어?? 집계된 비율이 너무낮네??(클릭률이 5개이하등..) 그러면 카이제곱을 하고싶지만 어쩔 수 없이 피셔의 정확성 검정을 해야겠다.." 라는 식의 접근이 올바르다.

profile
문제를해결하는도구로서의"데이터"

0개의 댓글