Confusion Matrix (혼동 행렬)

조은별·2025년 5월 10일

ICT 기초 인강 독학 - 머신러닝

목록 보기

17/18

이 문서는 분류 문제에서 모델의 성능을 평가하는 대표 지표인
Confusion Matrix (혼동 행렬)의 개념, 구성 요소, 해석 방법을 정리

1. Confusion Matrix란?

이진 또는 다중 분류 모델의 예측 성능을 직관적으로 표현하는 행렬
실제 클래스와 모델이 예측한 클래스 간의 상관 관계를 2차원 표 형태로 정리

2. 혼동 행렬 구성 (이진 분류 기준)

	예측 Positive	예측 Negative
실제 Positive	TP (True Positive)	FN (False Negative)
실제 Negative	FP (False Positive)	TN (True Negative)

TP: 실제 Positive인데, 예측도 Positive (정답)
FN: 실제 Positive인데, 예측은 Negative (실패)
FP: 실제 Negative인데, 예측은 Positive (실패)
TN: 실제 Negative이고, 예측도 Negative (정답)

Confusion Matrix Example

3. 주요 평가 지표

1) Accuracy (정확도)

전체 데이터 중 올바르게 분류된 비율

Accuracy = (TP + TN) / (TP + TN + FP + FN)

2) Precision (정밀도)

Positive라고 예측한 것 중 실제로 Positive인 비율

Precision = TP / (TP + FP)

3) Recall (재현율, 민감도)

실제 Positive 중에서 모델이 올바르게 예측한 비율

Recall = TP / (TP + FN)

4) F1-score

Precision과 Recall의 조화 평균

F1 = 2 * (Precision * Recall) / (Precision + Recall)

4. 왜 중요한가?

단순 Accuracy만 보는 것은 위험
- 예: 불균형 데이터에서 95% 정확도라도 실제 Positive를 거의 못 맞출 수 있음
Recall과 Precision을 함께 고려해야 실제 성능을 올바르게 해석할 수 있음

5. 느낀 점

혼동 행렬은 단순 표처럼 보이지만,
정확도 외에 다양한 지표를 도출할 수 있어 모델 평가에 필수적이다.
특히 데이터 불균형 문제에서는 Recall 중심인지, Precision 중심인지
목표에 따라 판단 기준을 달리해야 하는데, 그 기준이 되는 게 바로 이 혼동 행렬이었다.

조은별

기록과 회고를 통해 성장하는 데이터, AI 엔지니어 지망생입니다.