T-test, chi-square test를 공부하다보니 귀무가설과 대립가설을 어떻게 설정해야 하는지 헷갈릴 때가 있었다. p-value에 따라 귀무가설의 기각 여부가 결정되니, 내가 어떻게 세우느냐에 따라 검정 결과가 완전히 뒤바뀔 수도 있기 때문에 잘 이해하고 넘어가야 할 것 같다.
그래서 귀무/대립가설의 의미는 무엇이고, 통상적으로 어떻게 설정하는지를 정리해본다.
우리는 귀무가설과 대립가설을 언제 세울까?
그건 바로 어떤 연구를 통해 얻은 사실이 있는데 이게 진짜 맞는지 통계적으로 검증하고자 할 때이다. 이 상황을 머릿속에 두고 다음을 보자.
귀무가설은새로울 게 없다인 가설이다.
다른 말로 귀무가설은 부정적, 소극적, 보수적, 전통적인 입장이며, 우리가 제발 틀리기를 기도하는 가설이다. '기존에 알려진 사실'로 생각해도 된다.
반면, 대립가설은무언가 새로운 것이 있다는 가설이다.
다른 말로는 긍정적, 적극적, 진취적, 미래 지향적인 입장이며, 우리가 맞다고 검증하고 싶은 새로운 사실이다.
이게 무슨 뜻일까? 예시를 보자.
ex 1)
'A 온라인 쇼핑몰'에서 상품 상세페이지 내 Buy 버튼의 위치를 두고 A/B Test를 진행한다.
ex 2)
코로나 바이러스 치료를 위해 개발된 A약이 실제로 효과가 있는지 보고 싶다.
ex +) 위 예시에 비해 내가 헷갈리는 것
남학생과 여학생의 성적 샘플을 비교한다.
A대학 남학생의 평균 키가 175cm인지 아닌지를 보고자 한다.
차이가 있다 없다로 생각하면 위 예시도 앞의 두 예시와 맥락이 같다. 그렇게 기억하자.
이쯤에서 이런 생각이 든다.
아니 그냥 새롭게 발견한 것, 기대하는 바(=대립가설)만 검정하면 되지, 왜 귀무가설까지 세워서 수고스럽게 하는거지?
먼저 귀무가설은 기존에 알려져 있는 것이기 때문에 새로운 사실인 대립가설보다 더 정확하게 진술할 수 있기 때문이다. 더 정확하게 진술할 수 있다는 것은 상대적으로 더 쉽게 검증할 수 있다는 뜻이기도 하다.
또 상황에 따라 대립가설은 여러 개일 수도 있다. A,B,C약의 효능 차이가 있다는 것을 증명하기 위한 상황에서
검정 결과를 바탕으로 귀무가설과 대립가설 중 채택을 할 때, 결과에 대해서는 늘 오류의 가능성이 있음을 유의해서 생각하자.
p-value > 0.05라고 귀무가설이 무조건 맞다는 뜻이 결코 아니라는 것이다.
우리가 표본을 뽑아서 검정하는 이유는 모집단의 모든 경우를 다 볼 수 없기 때문이다. 따라서 오류는 존재할 수 있고 귀무가설의 채택 혹은 기각을 확률의 범주로 생각하는 것이 좋을 것 같다.
귀무/대립가설에 대해서는 우선 이 정도로 기억하고, 앞으로 더 다양한 케이스를 만나며 헷갈리는 부분이 있다면 더 공부해나가면 될 것 같다.
정리가 너무 잘 돼있어서 이해에 도움이 많이 됐습니다. 감사합니다!