검정력이란?

yoonene·2022년 4월 27일
0

면접대비

목록 보기
2/17

Q: 검정력(statistical power)은 무엇일까요?


검정력 = P(rej H0 | H1) = ( 1- β )

검정력이란 대립가설이 참일 때 귀무가설을 기각할 확률, 즉 대립가설을 채택할 확률을 뜻합니다.
다시 말해 내 연구가설이 맞을 때 연구가설을 맞다고 예측할 확률을 의미합니다.
따라서 검정력은 크면 클수록 좋습니다.

그림에서 왼쪽 분포는 귀무가설의 확률분포이고 오른쪽 분포는 표본을 통해 구한 대립가설의 확률분포입니다.
c (critical value, 임계치)를 기준으로 오른쪽은 대립가설을 채택하고 왼쪽은 귀무가설을 채택합니다.
따라서 β는 대립가설이 참일 때 귀무가설을 채택할 확률(제 2종 오류)을 의미하고 α는 귀무가설이 참일 때 귀무가설을 기각하고 대립가설을 채택할 확률(제 1종 오류)를 의미합니다. 두 오류 모두 작을수록 좋지만 두 오류는 trade-off 관계입니다.

보통 본인의 연구가설이 유의한지 가설을 검정할 때에는 귀무가설을 참이라고 가정하고 p-value를 기준으로 귀무가설 기각 여부를 결정합니다. 즉 α를 기준으로 검정합니다.

반면 β는 표본 데이터의 크기를 결정하는데 사용될 수 있습니다.

표본의 크기가 크면 클수록 모집단을 잘 표현할 수 있기 때문에 두 번째 그림처럼 β가 작아지고 따라서 검정력인 1-β가 커집니다. 즉 표본의 크기가 검정력을 결정합니다.

따라서 귀무가설이 참이라는 가정하에 검정하는 가설검정 뿐만 아니라, 표본 데이터를 얼만큼 추출해야 신뢰있는 예측을 할 수 있는지 결정하기 위해 검정력을 활용할 수 있습니다.

  • 추가 용어 정리
    • 가설 검정: 귀무가설, 대립가설 중 하나를 채택하고 나머지를 기각시키는 결정을 내리는 과정
    • 귀무가설(H0) : 대립가설이 참이라는 확실한 근거가 없을 때 채택하는 가설
    • 대립가설(H1) : 표본 정보로부터 입증하고자 하는 가설
    • 검정 통계량: 가설 검정에 이용하는, 검정의 기준을 결정하는 통계량
    • 제 1종 오류 : P(reject H0 l H0) 알파
    • 제 2종 오류 : P(not reject H0 l H1) 베타
    • p-value(유의확률) : 검정통계량의 관측값에 대해 H0을 기각할 수 있는 가장 작은 P(reject H0 l H0)

면접 질문 출처
https://github.com/zzsza/Datascience-Interview-Questions

profile
NLP Researcher / Information Retrieval / Search

0개의 댓글