Receiver Operating Characteristic Curve (ROC Curve)

J.H.L·2022년 7월 20일
0

Receiver Operating Characteristic Curve (ROC Curve)

  • FPR: 실제 값이 Negative인 애 중에서 False Positive인 비율
  • TPR: 실제 값이 Positive인 애 중에서 True Positive인 비율

: x축이 FPR, y축이 TPR인 곡선

  • FPR(False Positive Rate): FPFP+TN\frac{FP}{FP+TN} = 1-TNR = 1TNFP+TN1-\frac{TN}{FP+TN}
    - 실제 값이 Negative인 애들 중에서 내가 False Positive로 예측한 비율
    • 즉 Negative인 것들 중에서 Positive로 잘못 분류된 Negative 샘플의 비율
  • TPR(True Positive Rate): TPTP+FN\frac{TP}{TP+FN}
    - 실제 값이 Positive인 애들 중에서 내가 실제로 True Positive로 예측한 비율
    - Recall의 다른 이름
  • TNR: TNFP+TN\frac{TN}{FP+TN}
    - Negative로 분류한 애들 중에서 True Negative로 예측한 비율
    • 특이도 라고도 한다.

따라서 ROC curve는 Recall (민감도)에 대한 1-특이도 그래프이다.

  • ROC curve에서도 Tradeoff가 있다.

  • TPR이 높을 수록 FPR이 늘어나므로, 안 좋은 것.

  • 좋은 분류기는 위에 보이는 y=x 형태의 점선에서 최대한 멀리 떨어져 있어야 한다.

이때 AUC(곡선 아래의 면적)을 측정할 때 1에 가까울 수록 좋은 것.

랜덤 분류기는 Positive/Negative를 랜덤으로 선택하기 때문에 0.5의 AUC 값이 나온다.

profile
포항공대 인공지능 대학원에 재학중인 대학원생입니다.

0개의 댓글