여기서 정밀도(Precision)과 재현율(Recall)은 상호보완적이다.
(예를 들어 한달 30일 동안 맑은 날이 20일이었는데, 확실한 2일만 맑다고
예측을 하면 Precision의 FP는 0이라 Precision은 100%가 나오게 된다. 이러한 문제가 있어 실제로 맑은 20일 중에서 맑다고 예측한 날도 같이 고려해야 한다. 그래서 Recall을 함께 고려하면 실제 맑은 날 중에서 맑다고 옳게 예측한 날의 비율을 함께 고려하게 되어(이때는 10%) 제대로 평가할 수 있다.)
당연히 이 두 지표가 모두 높을 수록 좋은 모델이다.
F1-measure
앞에서 서로 상호 보완적이라고 한 정밀도(Precision)와 재현율(Recall)을 수식으로 표현하면 조화 평균을 구하면 된다.
즉 Precision이나 Recall 중 어느 하나라도 0에 가깝게 값이 낮게 나오면 F1-measure(F1 score)도 같이 낮게 나오게 하기 위해서 조화 평균을 사용한다. 만일 조화 평균을 사용하지 않고 일반 산술 평균을 사용하면 둘 중 하나라도 값이 높으면 전체 평균치가 높게 나올 것이다. F1−measure=Precision+Recall2⋅Precision⋅Recall
G-mean
negative 결과에 가중치를 두어, 즉 성능이 더 나쁜 쪽에 더 가중치를 두어 성능이 나쁜 경우도 예측 가능하도록 만든 지표가 있는데 이 지표가 𝐺−𝑚𝑒𝑎𝑛이다. G−mean=Recall⋅Specificity
4.2 ROC(Receiver Operation Characteristic) curve
ROC curve에서 TPR(True Positive Ratio, Recall)은 최대로 하고 FPR(False Positive Ration, 1-Specificity)은 최소로 하는게 가장 좋은 모델이기 때문에, 붉은 색 혹은 주황색 선의 아래 부분의 면적이 넓을 수록(최대값은 1) 좋은 모델로 평가 받는다.
따라서 모델 A보다 모델 B가 더 좋은 모델이다.
이 때의 면적을 AUC(Area Under Cover)라고 하고 0과 1사이의 값을 갖는다. 당연히 1에 가까울 수록 좋은 값이다.
같은 의미인데 다시 정리하면 ROC curve에서 TPR은 최대로 하고 FPR은 최소로 하는 지점이 최적화된 임계치의 위치인데, 그래프의 붉은 색 curve에서 별표 부분이 최적화된 값의 위치이다.