검정력(檢定力, statistical power)는 대립가설이 사실일 때, 이를 사실로서 결정할 확률이다.
-위키백과
2종 오류가 "대립가설이 사실일 때, 이를 기각할 확률"이므로 이 된다.
그냥 간단하게 생각해서 통계적으로 유의하다는 결론을 내기 위해서 충분해야 하는 수치.
자료를 모으기 전후 모두 검정력 분석을 시행할 수 있는데, 실험 전에 시행하면 적절한 표본크기를 정할 수 있게 된다.
귀무가설 유의성 검정의 단점은 표본이 충분히 크면 모든 크기의 효과는 결국 통계학적 유의성을 보인다는 점.
따라서 검정 시 효과크기도 같이 보여야 한다.
효과크기란 연구하고 있는 현상이 실제로 모집단에 존재하는 정도를 나타내는 수치
공식은 (두 표본 집단의 평균 차이)/(두 집단의 평균차이로 추정된 표준편차)
0.2 이하면 작은 효과크기, 0.5면 중간 크기, 0.8 이상이면 큰 효과라고 한다.
이 효과크기가 표본크기를 좌우하게 된다.
👨🏫 실제 검정에서 평균이 차이있다는 것이 중요한 게 아니라,
그게 얼만큼 맥락있게 차이나는지가 중요.
따라서 4가지 중 3개만 알아도 한 가지를 구할 수 있다.
실습은 [데이터 과학을 위한 통계(2판): 데이터 분석에서 머신러닝까지 파이썬과 R로 살펴보는 50가지 핵심 개념] 을 참고했다.
배너 클릭률이 1.1%라고 하고, 10% 증가한 1.21%를 원한다고 가정하자.
이만큼의 효과를 알아내기 위해서 필요한 표본크기는 ?
# 파이썬, r에서 단방향 검정 시 대립가설은 '더 크다'
import statsmodels.api as sm
effect_size = sm.stats.proportion_effectsize(0.0121, 0.011)
analysis = sm.stats.TTestIndPower()
# power = 검정력
result = analysis.solve_power(effect_size=effect_size, alpha=0.05, power=0.8, alternative='larger')
print('Sample size : {}'.format(result))
약 10만의 표본크기는 있어야 한다.