χ² 검정의 기본적 아이디어는 관측빈도와 예측할 수 있는 기대빈도의 차이를 비교하는 것
독립성은 "변수"끼리의 독립성을 보는 것입니다. 조금 더 쉽게 이야기하면 독립이다 하고 가정한 후 진짜 독립인가를 확인하는 것인데요, 한 개의 표본 집단에서 변수들을 뽑아서 확인하는 검정입니다. 2개의 변수가 관련이 있는가를 보는 거죠.
독립일 때의 기대빈도와 관측빈도가 같다면 독립
기본적으로 변수끼리의 독립을 가정
H0 : 관심 Feature끼리 서로 관련이 없다(독립적이다. 예측한 기대빈도와 동일하다,
H1 : 관심 Feature끼리 서로 관련이 있다
동질성은 서로 다른 표본 집단의 변수의 동질성을 보는 것이니까, 서로 다른 집단에서 같은 변수를 표집 해야 합니다.
표집 집단 끼리의 예측한 기대 빈도와 관측 빈도의 분포가 같다면 동질성
서로 분포가 동일하다고 가정
H0 : 두개의 그룹이 각 변수(Feature)에 대하여 서로 분포가 동일하다, 분포 가정이 가능하다.
H1 : 두개의 그룹이 각 변수(Feature)에 대하여 서로 분포가 동일하지 않다