10. 효과 없는데 있다고? 있는데 없다고? — Type 1 & Type 2 Error

Jason·2025년 3월 8일

A/B test

목록 보기
10/25
post-thumbnail

10편. 효과 없는데 있다고? 있는데 없다고? — Type 1 & Type 2 Error

📌 A/B 테스트 완전 정복 시리즈 | 10편 / 25편
Part 4. 가설과 오류 — "무엇을 검증할 것인가"


들어가며

A/B 테스트에서 내리는 판단은 크게 4가지 경우가 있습니다:

실제로 효과 없음 (H₀ 참)실제로 효과 있음 (H₁ 참)
"효과 없다"로 판단✅ 올바른 판단Type 2 Error
"효과 있다"로 판단Type 1 Error✅ 올바른 판단

Type 1 Error (제1종 오류) — 거짓 양성

효과가 없는데, 있다고 잘못 판단하는 것

  • 비유: 건강한 사람에게 "병이 있다"고 오진
  • A/B 테스트: 새 기능이 효과 없는데 "효과 있다!"고 출시 → 자원 낭비
  • 확률: α (유의 수준) 로 통제. α = 0.05면, 5% 확률로 이 실수를 할 수 있음

Type 2 Error (제2종 오류) — 거짓 음성

효과가 있는데, 없다고 잘못 판단하는 것

  • 비유: 실제 환자에게 "건강하다"고 오진
  • A/B 테스트: 새 기능이 정말 좋은데 "효과 없음"으로 폐기 → 기회 손실
  • 확률: β 로 표현. 보통 β = 0.2 이하를 목표로 함

어떤 오류가 더 위험할까?

도메인에 따라 다릅니다:

상황더 위험한 오류이유
의료 진단Type 2환자를 놓치면 생명 위험
금융 사기 탐지Type 2사기를 정상으로 판단하면 큰 손실
신기능 출시Type 1효과 없는 기능에 개발 자원 낭비

α와 β의 트레이드오프

α를 줄이면 (더 엄격하게 판단하면) → Type 1 Error ↓ 하지만 Type 2 Error ↑

이 트레이드오프를 조절하는 핵심이 바로 검정력(Power = 1 - β) 입니다.

보통 A/B 테스트에서는:

  • α = 0.05 (Type 1 Error를 5% 이하로)
  • Power = 0.8 (Type 2 Error를 20% 이하로)

이 숫자들은 뒤에서 샘플 크기 계산할 때 다시 등장합니다.


다음 편 예고

자, 가설도 세웠고 오류도 이해했습니다.

이제 "실제로 어떻게 검증하는가" — 검정 도구를 배울 차례입니다.

다음 편에서는 A/B 테스트의 핵심, p-value를 완전 정복합니다.

profile
Data Analyst | Thoughts Become Things. 할 수 있다고 생각하면 할 수 있다. 할 수 없다고 생각하면 할 수 없다. | www.linkedin.com/in/명수-제-7ab843200

0개의 댓글