귀무가설, 대립가설의 의미와 예시

신두다·2022년 4월 9일

공부노트

목록 보기

5/12

T-test, chi-square test를 공부하다보니 귀무가설과 대립가설을 어떻게 설정해야 하는지 헷갈릴 때가 있었다. p-value에 따라 귀무가설의 기각 여부가 결정되니, 내가 어떻게 세우느냐에 따라 검정 결과가 완전히 뒤바뀔 수도 있기 때문에 잘 이해하고 넘어가야 할 것 같다.

그래서 귀무/대립가설의 의미는 무엇이고, 통상적으로 어떻게 설정하는지를 정리해본다.

의미

우리는 귀무가설과 대립가설을 언제 세울까?

그건 바로 어떤 연구를 통해 얻은 사실이 있는데 이게 진짜 맞는지 통계적으로 검증하고자 할 때이다. 이 상황을 머릿속에 두고 다음을 보자.

귀무가설 (Null Hypothesis)

귀무가설은새로울 게 없다인 가설이다.
다른 말로 귀무가설은 부정적, 소극적, 보수적, 전통적인 입장이며, 우리가 제발 틀리기를 기도하는 가설이다. '기존에 알려진 사실'로 생각해도 된다.

대립가설 (Alternative Hypothesis)

반면, 대립가설은무언가 새로운 것이 있다는 가설이다.
다른 말로는 긍정적, 적극적, 진취적, 미래 지향적인 입장이며, 우리가 맞다고 검증하고 싶은 새로운 사실이다.

이게 무슨 뜻일까? 예시를 보자.

예시

ex 1)
'A 온라인 쇼핑몰'에서 상품 상세페이지 내 Buy 버튼의 위치를 두고 A/B Test를 진행한다.

여기서 A는 기존에 사용하고 있던 상품 상세페이지이고, B는 Buy 버튼의 위치를 변경한 상품 상세 페이지이다.
이때 귀무가설, 대립가설은 아래와 같다.
- 귀무가설: A와 B는 유의미한 차이가 없다.
  - (= B가 그렇게 새로울 게 없어!)
- 대립가설: A와 B는 유의미한 차이가 있다.
  - (= 아냐 B는 새로워!)
만약, A/B test를 진행했는데 A, B가 비슷하게 나왔다면?
- 우리는 굳이 새로운 B를 선택할 이유가 없게 된다.
  - p-value < 0.05 일 때 귀무가설을 기각한다는 의미는 차이가 있을 확률이 95% 정도는 되어야 한다는 것이다.

ex 2)
코로나 바이러스 치료를 위해 개발된 A약이 실제로 효과가 있는지 보고 싶다.

귀무가설: A약은 효과가 없다.
대립가설: A약은 효과가 있다.

ex +) 위 예시에 비해 내가 헷갈리는 것
남학생과 여학생의 성적 샘플을 비교한다.

귀무가설: 두 집단의 성적 평균은 같다. (차이가 없다)
대립가설: 두 집단의 성적 평균은 다르다. (차이가 있다)

A대학 남학생의 평균 키가 175cm인지 아닌지를 보고자 한다.

귀무가설: 평균 키는 175와 같다. (차이가 없다)
대립가설: 평균 키는 175와 다르다. (차이가 있다)

차이가 있다 없다로 생각하면 위 예시도 앞의 두 예시와 맥락이 같다. 그렇게 기억하자.

우리는 왜 귀무가설을 세우는가?

이쯤에서 이런 생각이 든다.

아니 그냥 새롭게 발견한 것, 기대하는 바(=대립가설)만 검정하면 되지, 왜 귀무가설까지 세워서 수고스럽게 하는거지?

먼저 귀무가설은 기존에 알려져 있는 것이기 때문에 새로운 사실인 대립가설보다 더 정확하게 진술할 수 있기 때문이다. 더 정확하게 진술할 수 있다는 것은 상대적으로 더 쉽게 검증할 수 있다는 뜻이기도 하다.

또 상황에 따라 대립가설은 여러 개일 수도 있다. A,B,C약의 효능 차이가 있다는 것을 증명하기 위한 상황에서

귀무가설은 '세 약의 효능에는 차이가 없다' 하나지만, 대립가설은 '세 약 모두에 차이가 있다', 'A,B약 간에는 차이가 없고 C약과는 차이가 있다' 등 여러 개가 존재할 수 있다.
이때 귀무가설 딱 1개를 검정하는 것이, 모든 대립가설 하나하나를 다 검증하여 내가 주장한 바가 맞다고 증명하는 것보다 더 쉽다.
(번외로, 우리는 대립가설이 여러 개가 될 수 있는 경우 어떤 것을 대립가설로 생각할지 신중히 선택해야 한다)

마치며

검정 결과를 바탕으로 귀무가설과 대립가설 중 채택을 할 때, 결과에 대해서는 늘 오류의 가능성이 있음을 유의해서 생각하자.

p-value > 0.05라고 귀무가설이 무조건 맞다는 뜻이 결코 아니라는 것이다.

참고로 통상적으로 5%를 기준으로 보는 이유는 옛날옛적 프랑스에 통계학자들이 모여서 그렇게 하기로 정했기 때문이라는 얘기가 있다.

우리가 표본을 뽑아서 검정하는 이유는 모집단의 모든 경우를 다 볼 수 없기 때문이다. 따라서 오류는 존재할 수 있고 귀무가설의 채택 혹은 기각을 확률의 범주로 생각하는 것이 좋을 것 같다.

이와 관련해서는 1종 오류(False Positive), 2종 오류(False Negative)라는 개념이 있다.

귀무/대립가설에 대해서는 우선 이 정도로 기억하고, 앞으로 더 다양한 케이스를 만나며 헷갈리는 부분이 있다면 더 공부해나가면 될 것 같다.

참고한 자료

'실패를 기도하는 이론: 귀무가설', 공돌이의 수학정리노트 (유튜브)
'Hypothesis Testing and The Null Hypothesis, Clearly Explained!!!', StatQuest with Josh Starmer (유튜브)
'Ch09_01.가설검정01', KC대학교 빅데이터경영학과 이상철 교수
(유튜브)
https://ko.wikipedia.org/wiki/%EA%B7%80%EB%AC%B4_%EA%B0%80%EC%84%A4
https://post.naver.com/viewer/postView.nhn?volumeNo=31634505&memberNo=53770451