- 예측 Negative(0) 예측 Positive(1) 실제 Negotive(0) TN(True Negative) FP(False Positive) ------------------- --------------------- ------------------- 실제 Positive(1) FN(False Negative) TP(True Positive)
앞에 T인 경우 : 예측한게 맞았다.
앞에 F인 경우 : 예측한게 틀렸다.
정밀도(Precision) = TP / (FP + TP)
정밀도는 양성 예측 정확도라고도 부릅니다.
FP가 커지면 정밀도는 작아집니다 (FP가 분모에 위치하기 때문에)
FP가 작아지면 정밀도는 커집니다 (FP가 분모에 위치하기 때문에)
정밀도는 모델이 Positive(양성)으로 예측한것들 중에서 실제로 얼마나 잘 맞췄는가를 말하는 비율입니다.
재현율(Recall) = TP / (FN + TP)
예측을 성공한 양성의 개수 / 실제 양성의 개수
정밀도를 사용하는 경우와 재현율을 사용하는 경우는 무엇이 더 critical한 문제를 일으키느냐에 따라서 정해집니다.
정밀도△ ↔ 재현율▽
정밀도▽ ↔ 재현율△
임계값은 예측 결정 확률이라고도 부릅니다.
즉, 분류하고자 하는 목적의 확률을 일컫습니다.
FN▽ => Recall(재현율)△
└ why? : FN이 Recall을 구하는 공식의 분모에 위치하기 때문에
Threshold▽ => FN▽ && FP△
└ why? :
- FN▽ => Negative로 예측할게 줄어들기 때문에
- FP△ => Positive로 예측할게 늘어나기 때문에
Theshold△ => FN△ && FP▽
└ why? :
- FN▽ => Negative로 예측할게 늘어나기 때문에
- FP△ => Positive로 예측할게 줄어들기 때문에