분류 성과 지표

코딩다시시작·2025년 2월 10일

LG DX SCHOOL

목록 보기

6/33

Confusion Matrix는 분류 모델의 예측 결과를 정리한 표

실제 / 예측	Positive(1)	Negative(0)
Positive(1)	TP	FN
Negative(0)	FP	TN

분류 모델이 전체 데이터에서 얼마나 정확하게 예측했는지

Accuracy = \frac{TP + TN}{TP + TN + FP + FN}

✅ 장점: 직관적인 성능 평가 가능
❌ 단점: 데이터가 불균형할 경우 성능 해석이 어려움 (예: 99%가 Negative일 때 Accuracy가 높아도 실제 성능이 좋다고 보기 어려움)

실제 Positive 중에서 모델이 올바르게 Positive로 예측한 비율

FN(거짓 음성)이 중요한 경우 사용 (예: 질병 진단, 사기 탐지)

Recall = \frac{TP}{TP + FN}

✅ 장점: FN(실제 Positive를 놓치는 경우)을 최소화할 때 유용
❌ 단점: FP가 증가할 수 있음

모델이 Positive라고 예측한 것 중 실제로 Positive인 비율

FP(거짓 양성)가 중요한 경우 사용 (예: 스팸 필터링, 광고 추천)

Precision = \frac{TP}{TP + FP}

✅ 장점: FP(실제 Negative를 Positive로 잘못 예측하는 경우)를 최소화할 때 유용
❌ 단점: FN이 증가할 수 있음

실제 Negative 중에서 모델이 올바르게 Negative로 예측한 비율

Recall과 반대 개념 (예: 정상인을 질병으로 진단하면 안 되는 경우)

Specificity = \frac{TN}{TN + FP}

✅ 장점: FP를 줄이는 데 유용
❌ 단점: FN이 증가할 수 있음

Precision과 Recall의 조화 평균
두 지표 간 균형을 맞추는 데 사용

F1 Score = 2 \times \frac{Precision \times Recall}{Precision + Recall}

✅ 장점: Precision과 Recall의 균형을 맞출 때 유용
❌ 단점: 데이터 불균형이 심할 경우 한계가 있을 수 있음

ROC (Receiver Operating Characteristic) 곡선은 TPR(Recall)과 FPR(1-Specificity) 간의 관계를 나타낸 그래프
AUC (Area Under the Curve)는 곡선 아래 면적으로, 모델의 전체적인 성능을 평가

✅ 장점: 임계값 변화에 따른 모델 성능을 비교할 수 있음
❌ 단점: 특정 상황에서는 Precision-Recall Curve가 더 유용할 수도 있음