
이 문서는 분류 문제에서 모델의 성능을 평가하는 대표 지표인
Confusion Matrix (혼동 행렬)의 개념, 구성 요소, 해석 방법을 정리
| 예측 Positive | 예측 Negative | |
|---|---|---|
| 실제 Positive | TP (True Positive) | FN (False Negative) |
| 실제 Negative | FP (False Positive) | TN (True Negative) |

전체 데이터 중 올바르게 분류된 비율
Accuracy = (TP + TN) / (TP + TN + FP + FN)
Positive라고 예측한 것 중 실제로 Positive인 비율
Precision = TP / (TP + FP)
실제 Positive 중에서 모델이 올바르게 예측한 비율
Recall = TP / (TP + FN)
Precision과 Recall의 조화 평균
F1 = 2 * (Precision * Recall) / (Precision + Recall)
혼동 행렬은 단순 표처럼 보이지만,
정확도 외에 다양한 지표를 도출할 수 있어 모델 평가에 필수적이다.
특히 데이터 불균형 문제에서는 Recall 중심인지, Precision 중심인지
목표에 따라 판단 기준을 달리해야 하는데, 그 기준이 되는 게 바로 이 혼동 행렬이었다.