
분류 모델이 예측한 결과와 실제 정답을 비교하여 성능을 평가하는 표
예측이 맞았는지/틀렸는지를 한눈에 볼 수 있다.

전체 중 모델이 실제로 맞춘 비율. 클래스 불균형 데이터에는 적합하지 않을 수 있다.
모델이 Positive라고 예측한 것 중 실제로 맞은 비율
실제 Positive 중 모델이 잘 잡아낸 비율.
Precision과 Recall의 조화 평균. 불균형 데이터 평가에 유용하다.
데이터 불균형
실제 신용카드 거래 중 사기는 극소수기 때문에,
10,000건 중 9,990건은 정상이고 10건만 사기라면 ?
무조건 정상이라고만 예측해도 정확도 99.9%,그러나 Recall = 0
이므로 사기를 하나도 잡을 수 없음.
Precision(정밀도) vs Recall(재현율)
정밀도 : 잡아낸 거래 중 사기일 확률
→ 너무 낮으면 정상 거래를 막아서 고객 불편 높아짐
재현율 : 실제 사기를 놓치지 않고 잡아낸 비율
→ 낮으면 사기를 못잡는다는 의미
= 따라서 사기 탐지는 정상 거래를 차단하면 안되고, 동시에 사기를 놓쳐서도 안됨!!
그래서 F1-Score✅
Precision과 Recall의 적절한 조화가 이루어져야함.
둘 중 하나만 높은 경우보다, 둘다 적절히 높은 점수여야한다.
모델1 : Precision = 0.95, Recall = 0.20 → F1 = 0.33
모델2 : Precision = 0.80, Recall = 0.75 → F1 = 0.77
모델 2가 훨씬 현실적으로 유용한 모델임!