분류 평가 지표

김명준·2023년 12월 13일

MachineLearing

목록 보기
7/8

이진 분류(Confusion_matrix)

  • 정확도(Accuracy) : 맞춘비율(TN,TP) / 전체 (TN,FN,FP,TP)

  • 재현율(Recall) : 실제 양성 중에 예측 양성 비율
    TP/TP+FN

  • 정밀도(Precision) : 예측 양성 중에 실제 양성 비율
    TP/ TP+FP

재현율 정밀도는 trade-off 관계 (반대 관계)

  • 낮은 재현율보다 높은 정밀도를 선호하는 경우
    아이에게 유해 동영상 차단
  • 낮은 정밀도보다 높은 재현율을 선호하는 경우
    감시카메라로 도둑을 잡아내는 분류기

=> 재현율과 정밀도 비교 (trade-off 관계)
재현율 > 정밀도 : 실제 양성인 데이터 예측을 음성으로 잘못 판단하게 되면 문제가 되는 경우 (ex 암 판단, 도둑 판단하기)
재현율 < 정밀도 : 실제 음성인 데이터 예측을 양성으로 잘못 판단하게 되면 문제가 되는 경우 (ex 스팸 메일, 유해 동영상 차단)

다중 분류

F1- score : 정밀도와 재현율의 조화평균, 0~1까지로 표현, 1에 가까울수록 좋음

F = 2XprecisionXrecall/precision+recall
F가 높을수록 애매한 값이 없다.

profile
스인개 본점 빅데이터 과정

0개의 댓글