Precision의 정의
Precision은 모델이 Positive로 예측한 것들 중에서 실제로 Positive인 비율입니다.
공식:
Precision = TP / (TP + FP)
- TP (True Positive): 실제 Positive를 Positive로 예측
- FP (False Positive): 실제 Negative를 Positive로 예측 (잘못 예측)
왜 필요한가?
Precision은 "모델이 Positive라고 한 예측이 얼마나 정확한가"를 측정합니다.
중요한 경우:
- 스팸 필터: 정상 메일을 스팸으로 분류하면 안 됨
- 유죄 판결: 무고한 사람을 범죄자로 판단하면 안 됨
- 상품 추천: 관심 없는 상품을 추천하면 신뢰도 하락
- 의료 수술 결정: 건강한 사람을 환자로 오진하면 불필요한 수술
즉, "잘못된 경보(False Alarm)를 최소화해야 하는 상황"에서 중요합니다.
왜 "Precision"이라고 부르나?
Precision의 뜻은 "정밀도, 정확성"입니다.
명명 이유:
- 모델의 예측이 얼마나 정밀하고 정확한지를 나타냅니다
- "Positive라고 예측한 것이 진짜 Positive일 확률"이 높을수록 정밀한(precise) 모델입니다
Recall vs Precision 비교
| 관점 | Recall | Precision |
|---|
| 질문 | 실제 Positive 중 몇 개를 찾았나? | 내가 Positive라고 한 것 중 몇 개가 맞나? |
| 분모 | 실제 Positive (TP + FN) | 예측 Positive (TP + FP) |
| 중점 | 놓치지 않기 | 잘못 예측하지 않기 |
비유:
- Recall: 범죄자 100명 중 80명을 잡음 → Recall 80%
- Precision: 잡은 사람 90명 중 80명이 진짜 범죄자 → Precision 88.9%
Trade-off 관계
Recall과 Precision은 보통 반비례 관계입니다:
- Recall을 높이려면 → 더 많이 Positive로 예측 → FP 증가 → Precision 감소
- Precision을 높이려면 → 확실한 것만 Positive로 예측 → FN 증가 → Recall 감소
따라서 상황에 따라 어느 쪽이 더 중요한지 판단하여 모델을 조정해야 합니다!