[Classification Problem] Model 평가 및 지표 해석

jayce·2024년 6월 29일
post-thumbnail

Classification Model 평가 및 지표 해석


고려사항: Class의 Balance가 맞는가?

  • 평가 지표가 달라지게 됨

Confusion Matrix

  • TP(True Positive), 참양성: 예측한 값이 Positive이고 실제 값도 Positive인 경우
  • FN(False Negative), 거짓음성: 예측한 값이 Negative이고 실제 값은 Positive인 경우
  • FP(False Positive), 거짓양성: 예측한 값이 Positive이고 실제 Negative값은 인 경우
  • TN(True Negative), 참음성: 예측한 값이 Negative이고 실제 값도 Negative인 경우

Confusion Matrix를 기반으로 한 평가 지표

  • 정분류율(Accuracy) : 정확도는 직관적으로 모델 예측 성능을 나타내는 지표
  • 정밀도(Precision): 예측 Positive 중 실제도 Positive를 찾아낸 비율
    ⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀(미처 잡아내지 못한 개수가 많더라도 더 정확한 예측이 필요한 경우)
  • 재현율(Recall): 실제 Positive중 올바르게 Positive를 예측해 낸 비율
    ⠀⠀⠀⠀⠀⠀⠀⠀⠀(잘못 걸러내는 비율이 높더라도 참 값을 놓치는 일이 없도록, 의학, 불량)
  • 특이도(Specificity): 실제 Negative 중 올바르게 Negative를 찾아낸 비율
  • 도메인에 따라 잘 쓰이는 평가지표가 다름!! 🚨무조건 Accuracy만 보는 것은 위험!!!

Confusion Matrix 2023 version

0개의 댓글