Receiver Operating Characteristic Curve (ROC Curve)
- FPR: 실제 값이 Negative인 애 중에서 False Positive인 비율
- TPR: 실제 값이 Positive인 애 중에서 True Positive인 비율
: x축이 FPR, y축이 TPR인 곡선
- FPR(False Positive Rate): = 1-TNR =
- 실제 값이 Negative인 애들 중에서 내가 False Positive로 예측한 비율
- 즉 Negative인 것들 중에서 Positive로 잘못 분류된 Negative 샘플의 비율
- TPR(True Positive Rate):
- 실제 값이 Positive인 애들 중에서 내가 실제로 True Positive로 예측한 비율
- Recall의 다른 이름- TNR:
- Negative로 분류한 애들 중에서 True Negative로 예측한 비율
- 특이도 라고도 한다.
따라서 ROC curve는 Recall (민감도)에 대한 1-특이도 그래프이다.
ROC curve에서도 Tradeoff가 있다.
TPR이 높을 수록 FPR이 늘어나므로, 안 좋은 것.
좋은 분류기는 위에 보이는 y=x 형태의 점선에서 최대한 멀리 떨어져 있어야 한다.
이때 AUC(곡선 아래의 면적)을 측정할 때 1에 가까울 수록 좋은 것.
랜덤 분류기는 Positive/Negative를 랜덤으로 선택하기 때문에 0.5의 AUC 값이 나온다.