Confusion Matrix (혼동 행렬)

조은별·2025년 5월 10일
post-thumbnail

이 문서는 분류 문제에서 모델의 성능을 평가하는 대표 지표인
Confusion Matrix (혼동 행렬)의 개념, 구성 요소, 해석 방법을 정리


1. Confusion Matrix란?

  • 이진 또는 다중 분류 모델의 예측 성능을 직관적으로 표현하는 행렬
  • 실제 클래스와 모델이 예측한 클래스 간의 상관 관계를 2차원 표 형태로 정리

2. 혼동 행렬 구성 (이진 분류 기준)

예측 Positive예측 Negative
실제 PositiveTP (True Positive)FN (False Negative)
실제 NegativeFP (False Positive)TN (True Negative)
  • TP: 실제 Positive인데, 예측도 Positive (정답)
  • FN: 실제 Positive인데, 예측은 Negative (실패)
  • FP: 실제 Negative인데, 예측은 Positive (실패)
  • TN: 실제 Negative이고, 예측도 Negative (정답)

Confusion Matrix Example


3. 주요 평가 지표

1) Accuracy (정확도)

전체 데이터 중 올바르게 분류된 비율

Accuracy = (TP + TN) / (TP + TN + FP + FN)

2) Precision (정밀도)

Positive라고 예측한 것 중 실제로 Positive인 비율

Precision = TP / (TP + FP)

3) Recall (재현율, 민감도)

실제 Positive 중에서 모델이 올바르게 예측한 비율

Recall = TP / (TP + FN)

4) F1-score

Precision과 Recall의 조화 평균

F1 = 2 * (Precision * Recall) / (Precision + Recall)

4. 왜 중요한가?

  • 단순 Accuracy만 보는 것은 위험
    • 예: 불균형 데이터에서 95% 정확도라도 실제 Positive를 거의 못 맞출 수 있음
  • Recall과 Precision을 함께 고려해야 실제 성능을 올바르게 해석할 수 있음

5. 느낀 점

혼동 행렬은 단순 표처럼 보이지만,
정확도 외에 다양한 지표를 도출할 수 있어 모델 평가에 필수적이다.
특히 데이터 불균형 문제에서는 Recall 중심인지, Precision 중심인지
목표에 따라 판단 기준을 달리해야 하는데, 그 기준이 되는 게 바로 이 혼동 행렬이었다.

profile
기록과 회고를 통해 성장하는 데이터, AI 엔지니어 지망생입니다.

0개의 댓글