📌 A/B 테스트 완전 정복 시리즈 | 10편 / 25편
Part 4. 가설과 오류 — "무엇을 검증할 것인가"
A/B 테스트에서 내리는 판단은 크게 4가지 경우가 있습니다:
| 실제로 효과 없음 (H₀ 참) | 실제로 효과 있음 (H₁ 참) | |
|---|---|---|
| "효과 없다"로 판단 | ✅ 올바른 판단 | ❌ Type 2 Error |
| "효과 있다"로 판단 | ❌ Type 1 Error | ✅ 올바른 판단 |
효과가 없는데, 있다고 잘못 판단하는 것
효과가 있는데, 없다고 잘못 판단하는 것
도메인에 따라 다릅니다:
| 상황 | 더 위험한 오류 | 이유 |
|---|---|---|
| 의료 진단 | Type 2 | 환자를 놓치면 생명 위험 |
| 금융 사기 탐지 | Type 2 | 사기를 정상으로 판단하면 큰 손실 |
| 신기능 출시 | Type 1 | 효과 없는 기능에 개발 자원 낭비 |
α를 줄이면 (더 엄격하게 판단하면) → Type 1 Error ↓ 하지만 Type 2 Error ↑
이 트레이드오프를 조절하는 핵심이 바로 검정력(Power = 1 - β) 입니다.
보통 A/B 테스트에서는:
이 숫자들은 뒤에서 샘플 크기 계산할 때 다시 등장합니다.
자, 가설도 세웠고 오류도 이해했습니다.
이제 "실제로 어떻게 검증하는가" — 검정 도구를 배울 차례입니다.
다음 편에서는 A/B 테스트의 핵심, p-value를 완전 정복합니다.