가설 검정 = 가설(Hypothesis) + 검정(Testing)
가설: 주어진 사실 또는 조사하려고 하는 사실에 대한 주장 또는 추측
통계학에서는 특히 모수를 추정 할 때 모수가 엉떠하다는 증명하고 싶은 추측이나 주장을 가설이라고 함
귀무가설(Null hypothesis): 기존의 사실(아무것도 없다, 의미가 없다), 대립가설과 반대되는 가설로 연구하고자 하는 가설의 반대의 가설로 연구 목적이 아님
대립가설(Alternative hypothesis): 데이터로부터 나온 주장하고 싶은 가설 또는 연구의 목적으로 귀무가설의 반대
제1종 오류: 귀무가설이 참이지만, 귀무가설을 기각하는 오류, 제 1종 오류를 범할 확률의 최대허용 한계를 유의수준이라고 하며 알파로 표시
제2종 오류: 귀무가설이 기각해야 하지만, 귀무가설을 채택하는 오류
검정통계량: 귀무가설이 참이라는 가정하에 얻은 통계량
-> 검정결과 대립가설을 선택하게 되면 귀무가설을 기각(reject)함
-> 검정결과 귀무가설을 선택하게 되면 귀무가설을 기각하지 못한다고 표현함
P-value: 귀무가설이 참일 확률
-> 0~1사이의 표준화된 지표(확률값)
-> 귀무가설이 참이라는 가정하에 통계량이 귀무가설을 얼마나 지지 하는지를 나타낼 확률
기각역: 귀무가설을 기각시키는 검정통계량의 관측값의 영역
가설 검정의 절차
1) 가설 수립: (귀무가설)코로나 백신이 효과가 없다 , (대립가설)코로나 백신이 효과가 있다
2) 유의 수준 결정: 유의 수준 정의
3) 기각역 설정
4) 검정통계량 계산
5) 의사 결정
양측검정(two-side test): 대립가설의 내용이 같지 않다 또는 차이가 있다 등의 양쪽 방향의 주장
-> A백신과 B백신의 코로나 면역력에는 차이가 있다
-> A팀과 B팀의 평균 연봉은 차이가 있다
단측검정(one-side test): 한쪽만 검증하는 방식으로 대립가설의 내용이 크다 또는 작다 처럼 한쪽 방향의 주장
-> A제품의 수율이 B제품의 수율보다 크다
-> A팀의 평균 연봉이 B팀의 평균 연봉보다 크다







이 글은 제로베이스 데이터 취업 스쿨의 강의 자료 일부를 발췌하여 작성되었습니다