오차 행렬

Cloud_ Ghost·2022년 11월 7일
0

AI

목록 보기
2/37
-예측 Negative(0)예측 Positive(1)
실제 Negotive(0)TN(True Negative)FP(False Positive)
-----------------------------------------------------------
실제 Positive(1)FN(False Negative)TP(True Positive)

앞에 T인 경우 : 예측한게 맞았다.
앞에 F인 경우 : 예측한게 틀렸다.

정밀도(Precision)

정밀도(Precision) = TP / (FP + TP)

정밀도는 양성 예측 정확도라고도 부릅니다.

FP가 커지면 정밀도는 작아집니다 (FP가 분모에 위치하기 때문에)
FP가 작아지면 정밀도는 커집니다 (FP가 분모에 위치하기 때문에)

정밀도는 모델이 Positive(양성)으로 예측한것들 중에서 실제로 얼마나 잘 맞췄는가를 말하는 비율입니다.


재현율(Recall)

재현율(Recall) = TP / (FN + TP)

예측을 성공한 양성의 개수 / 실제 양성의 개수


정밀도를 사용하는 경우와 재현율을 사용하는 경우는 무엇이 더 critical한 문제를 일으키느냐에 따라서 정해집니다.

정밀도와 재현율은 Trade-off 관계입니다

정밀도△ ↔ 재현율▽
정밀도▽ ↔ 재현율△

임계값(Threshold)

임계값은 예측 결정 확률이라고도 부릅니다.
즉, 분류하고자 하는 목적의 확률을 일컫습니다.

임계값과 오차 행렬의 상관관계

FN▽ => Recall(재현율)△
└ why? : FN이 Recall을 구하는 공식의 분모에 위치하기 때문에

Threshold▽ => FN▽ && FP△
└ why? :

  • FN▽ => Negative로 예측할게 줄어들기 때문에
  • FP△ => Positive로 예측할게 늘어나기 때문에

  • Negative의 영역이 줄어들었다는 것은 Negative로 예측할게 줄어든다는 것을 의미하기 때문에
  • Positive의 영역이 늘어났다는 것은 Positive로 예측할게 많아진다는 것을 의미하기 때문에

Theshold△ => FN△ && FP▽
└ why? :

  • FN▽ => Negative로 예측할게 늘어나기 때문에
  • FP△ => Positive로 예측할게 줄어들기 때문에

  • Negative의 영역이 늘어났다는 것은 Negative로 예측할게 많아진다는 것을 의미하기 때문에
  • Positive의 영역이 줄어들었다는 것은 Positive로 예측할게 줄어든다는 것을 의미하기 때문에
profile
도망쳐서 도착한 곳에 낙원이란 있을 수 없는 거야.

0개의 댓글