카이제곱 검정

ilysm96·2023년 5월 12일
0

χ² 검정

χ² 검정의 기본적 아이디어는 관측빈도와 예측할 수 있는 기대빈도의 차이를 비교하는 것

독립성

  • 독립성은 "변수"끼리의 독립성을 보는 것입니다. 조금 더 쉽게 이야기하면 독립이다 하고 가정한 후 진짜 독립인가를 확인하는 것인데요, 한 개의 표본 집단에서 변수들을 뽑아서 확인하는 검정입니다. 2개의 변수가 관련이 있는가를 보는 거죠.

  • 독립일 때의 기대빈도와 관측빈도가 같다면 독립

  • 기본적으로 변수끼리의 독립을 가정
    H0 : 관심 Feature끼리 서로 관련이 없다(독립적이다. 예측한 기대빈도와 동일하다,
    H1 : 관심 Feature끼리 서로 관련이 있다

동질성

  • 동질성은 서로 다른 표본 집단의 변수의 동질성을 보는 것이니까, 서로 다른 집단에서 같은 변수를 표집 해야 합니다.

  • 표집 집단 끼리의 예측한 기대 빈도와 관측 빈도의 분포가 같다면 동질성

  • 서로 분포가 동일하다고 가정
    H0 : 두개의 그룹이 각 변수(Feature)에 대하여 서로 분포가 동일하다, 분포 가정이 가능하다.
    H1 : 두개의 그룹이 각 변수(Feature)에 대하여 서로 분포가 동일하지 않다

profile
안녕하세요 반갑습니다!

0개의 댓글