Q: p-value를 모르는 사람에게 설명한다면 어떻게 설명하실 건가요?
표본 통계량을 통해 모집단에 대한 가설을 검정할 때, 우선 대립가설과 귀무가설을 수립합니다. 대립가설이란 쉽게 말해 연구자가 주장하고자 하는 가설이고 이에 반대되는 가설을 귀무가설이라고 합니다. 귀무가설을 기본적으로 참으로 두고 이를 기각할 수 있느냐 없느냐를 판단하도록 하는 값을 p-value라고 합니다. 다시 말해 p-value는 귀무가설을 기각하고 대립가설을 채택할 수 있는지를 검정하기 위해 사용됩니다. 이 유의확률이 작을수록 귀무가설을 기각해야만 하는 증거가 강함을 의미합니다.
(p-value에 대해 더 자세히 설명하자면, 표본 평균을 기준으로 귀무가설을 기각한다고 가정하였을 때 제 1종 오류를 범할 확률의 최소값을 의미합니다. 여기서 제 1종 오류란 귀무가설이 참이지만 이를 기각하는 오류를 의미합니다. 그리고 이러한 오류를 허용할 수 있는 최대 확률인 유의수준을 설정합니다. 따라서 표본을 통해 구한 p-value값이 유의수준보다 크다면 귀무가설을 기각할 수 없고 작다면 기각하여 대립가설을 채택할 수 있습니다.)
면접 질문 출처
https://github.com/zzsza/Datascience-Interview-Questions