Imbalanced 데이터셋: Precision, Recall, F1 score 추천 (PR curve)
Balanced 데이터셋: AUC
- 이진분류기 성능 평가방법 AUC(area under the ROC curve)의 이해 https://bskyvision.com/entry/AUROC-%EC%84%B1%EB%8A%A5%EC%A7%80%ED%91%9C%EB%9E%80
- AUC-ROD 커브
https://bioinformaticsandme.tistory.com/328- 불균형(imbalanced) 데이터 모델링은 ROC curve를 사용을...
https://julie-tech.tistory.com/121- 분류 성능 평가 지표: 불균형 데이터에는 어떤 평가 지표가 좋을까? - 오차행렬 완벽 정리
https://eatchu.tistory.com/12- 분류성능평가지표 - Precision(정밀도), Recall(재현율) and Accuracy(정확도)
https://sumniya.tistory.com/26
위의 글에서는 Imbalanced 데이터 셋에서 f1 score를 추천한다고 적으신 것 같은데,
아래는 또 이렇게 나와 있네요.
'왜 Imbalanced 데이터에서 F1 score 보다 AUC가 더 나은 metric인가?'