T-test, chi-square test를 공부하다보니 귀무가설과 대립가설을 어떻게 설정해야 하는지 헷갈릴 때가 있었다. p-value에 따라 귀무가설의 기각 여부가 결정되니, 내가 어떻게 세우느냐에 따라 검정 결과가 완전히 뒤바뀔 수도 있기 때문에 잘 이해하고 넘어가야 할 것 같다.
그래서 귀무/대립가설의 의미는 무엇이고, 통상적으로 어떻게 설정하는지를 정리해본다.
우리는 귀무가설과 대립가설을 언제 세울까?
그건 바로 어떤 연구를 통해 얻은 사실이 있는데 이게 진짜 맞는지 통계적으로 검증하고자 할 때이다. 이 상황을 머릿속에 두고 다음을 보자.
귀무가설은새로울 게 없다
인 가설이다.
다른 말로 귀무가설은 부정적
, 소극적
, 보수적
, 전통적
인 입장이며, 우리가 제발 틀리기를 기도하는
가설이다. '기존에 알려진 사실'로 생각해도 된다.
반면, 대립가설은무언가 새로운 것이 있다
는 가설이다.
다른 말로는 긍정적
, 적극적
, 진취적
, 미래 지향적
인 입장이며, 우리가 맞다고 검증하고 싶은 새로운 사실이다.
이게 무슨 뜻일까? 예시를 보자.
ex 1)
'A 온라인 쇼핑몰'에서 상품 상세페이지 내 Buy 버튼의 위치를 두고 A/B Test를 진행한다.
ex 2)
코로나 바이러스 치료를 위해 개발된 A약이 실제로 효과가 있는지 보고 싶다.
ex +) 위 예시에 비해 내가 헷갈리는 것
남학생과 여학생의 성적 샘플을 비교한다.
A대학 남학생의 평균 키가 175cm인지 아닌지를 보고자 한다.
차이가 있다 없다로 생각하면 위 예시도 앞의 두 예시와 맥락이 같다. 그렇게 기억하자.
이쯤에서 이런 생각이 든다.
아니 그냥 새롭게 발견한 것, 기대하는 바(=대립가설)만 검정하면 되지, 왜 귀무가설까지 세워서 수고스럽게 하는거지?
먼저 귀무가설은 기존에 알려져 있는 것이기 때문에 새로운 사실인 대립가설보다 더 정확하게 진술할 수 있기 때문이다. 더 정확하게 진술할 수 있다는 것은 상대적으로 더 쉽게 검증할 수 있다는 뜻이기도 하다.
또 상황에 따라 대립가설은 여러 개일 수도 있다. A,B,C약의 효능 차이가 있다는 것을 증명하기 위한 상황에서
검정 결과를 바탕으로 귀무가설과 대립가설 중 채택을 할 때, 결과에 대해서는 늘 오류의 가능성이 있음을 유의해서 생각하자.
p-value > 0.05라고 귀무가설이 무조건 맞다는 뜻이 결코 아니라는 것이다.
우리가 표본을 뽑아서 검정하는 이유는 모집단의 모든 경우를 다 볼 수 없기 때문이다. 따라서 오류는 존재할 수 있고 귀무가설의 채택 혹은 기각을 확률의 범주로 생각하는 것이 좋을 것 같다.
귀무/대립가설에 대해서는 우선 이 정도로 기억하고, 앞으로 더 다양한 케이스를 만나며 헷갈리는 부분이 있다면 더 공부해나가면 될 것 같다.
정리가 너무 잘 돼있어서 이해에 도움이 많이 됐습니다. 감사합니다!