Q: 검정력(statistical power)은 무엇일까요?
검정력 = P(rej H0 | H1) = ( 1- β )
검정력이란 대립가설이 참일 때 귀무가설을 기각할 확률, 즉 대립가설을 채택할 확률을 뜻합니다.
다시 말해 내 연구가설이 맞을 때 연구가설을 맞다고 예측할 확률을 의미합니다.
따라서 검정력은 크면 클수록 좋습니다.
그림에서 왼쪽 분포는 귀무가설의 확률분포이고 오른쪽 분포는 표본을 통해 구한 대립가설의 확률분포입니다.
c (critical value, 임계치)를 기준으로 오른쪽은 대립가설을 채택하고 왼쪽은 귀무가설을 채택합니다.
따라서 β는 대립가설이 참일 때 귀무가설을 채택할 확률(제 2종 오류)을 의미하고 α는 귀무가설이 참일 때 귀무가설을 기각하고 대립가설을 채택할 확률(제 1종 오류)를 의미합니다. 두 오류 모두 작을수록 좋지만 두 오류는 trade-off 관계입니다.
보통 본인의 연구가설이 유의한지 가설을 검정할 때에는 귀무가설을 참이라고 가정하고 p-value를 기준으로 귀무가설 기각 여부를 결정합니다. 즉 α를 기준으로 검정합니다.
반면 β는 표본 데이터의 크기를 결정하는데 사용될 수 있습니다.
표본의 크기가 크면 클수록 모집단을 잘 표현할 수 있기 때문에 두 번째 그림처럼 β가 작아지고 따라서 검정력인 1-β가 커집니다. 즉 표본의 크기가 검정력을 결정합니다.
따라서 귀무가설이 참이라는 가정하에 검정하는 가설검정 뿐만 아니라, 표본 데이터를 얼만큼 추출해야 신뢰있는 예측을 할 수 있는지 결정하기 위해 검정력을 활용할 수 있습니다.
면접 질문 출처
https://github.com/zzsza/Datascience-Interview-Questions