Confusion Matrix

김동준·2025년 10월 2일

LLM

목록 보기
42/50

왜 "Confusion Matrix"라고 부르나?

Confusion의 뜻은 "혼동, 혼란"입니다.

명명 이유:

  • 모델이 어떤 클래스들을 서로 혼동(confuse)하는지를 보여주는 표이기 때문입니다
  • 예를 들어:
    • 고양이를 개로 잘못 예측 → 고양이와 개를 혼동
    • 숫자 3을 8로 잘못 예측 → 3과 8을 혼동
    • 암 환자를 건강하다고 예측 → Positive와 Negative를 혼동

"모델이 어디서 헷갈려하는가(confused)"를 명확히 보여주는 행렬이라는 의미입니다.

Confusion Matrix 구조 (2x2)

                예측값
              Positive  Negative
실제값 Positive   TP        FN
       Negative   FP        TN
  • 대각선(TP, TN): 올바르게 예측 (혼동 없음)
  • 비대각선(FP, FN): 잘못 예측 (혼동 발생!)

왜 필요한가?

1️⃣ 모델의 실수 패턴을 정확히 파악

단순 Accuracy만으로는 어떤 종류의 실수를 하는지 알 수 없습니다.

예시: 의료 진단

Confusion Matrix:
              예측: 암   예측: 건강
실제 암:        8         2      (FN=2, 암 환자 놓침!)
실제 건강:      5        985     (FP=5, 오진)
  • Accuracy: 99.3% (좋아 보임)
  • 하지만 암 환자 10명 중 2명을 놓침! (치명적)
  • FN이 2개라는 걸 Confusion Matrix로만 확인 가능

2️⃣ 클래스별 성능 차이 발견

예시: 다중 클래스 분류 (숫자 인식)

        예측: 0  1  2  3
실제 0:    95  2  1  2
실제 1:     1 98  0  1
실제 2:     5  1 85  9   ← 2를 3으로 자주 혼동!
실제 3:     2  0  8 90   ← 3을 2로 자주 혼동!
  • 숫자 2와 3을 서로 혼동하는 패턴 발견
  • 이 두 숫자의 특징을 더 잘 구분하도록 모델 개선 가능

3️⃣ 비즈니스 의사결정에 필요한 정보 제공

예시: 스팸 필터

              예측: 스팸  예측: 정상
실제 스팸:      450        50     (FN=50, 스팸 통과)
실제 정상:       30       470     (FP=30, 중요 메일 차단!)
  • FP=30: 중요한 메일 30개가 스팸으로 분류 → 사용자 불만
  • FN=50: 스팸 50개가 통과 → 불편하지만 덜 치명적
  • 비즈니스 관점: FP를 줄이는 게 더 중요 → Precision 중심 조정

4️⃣ 다양한 평가지표 계산의 기초

Confusion Matrix만 있으면 모든 지표를 계산할 수 있습니다:

Precision = TP / (TP + FP)
Recall = TP / (TP + FN)
Accuracy = (TP + TN) / (TP + TN + FP + FN)
F1-Score = 2 × (Precision × Recall) / (Precision + Recall)
Specificity = TN / (TN + FP)

5️⃣ 모델 개선 방향 제시

  • FN이 많으면 → Recall 개선 필요 → 임계값(threshold) 낮추기
  • FP가 많으면 → Precision 개선 필요 → 임계값 높이기
  • 특정 클래스 혼동이 많으면 → 해당 클래스 데이터 보강 또는 특징 추가

요약

"Confusion Matrix"라는 이름:

  • 모델이 어디서 혼동(confused)하는지 보여주는 표

왜 필요한가:
1. 단순 정확도의 함정을 피할 수 있음
2. 어떤 종류의 오류가 많은지 정확히 파악
3. 비즈니스 상황에 맞는 의사결정 가능
4. 모델 개선 방향을 구체적으로 제시

결국 Confusion Matrix는 "모델이 어디서 실수하는지 투명하게 보여주는 진단 도구"입니다! 🔍

profile
Story Engineer

0개의 댓글