1. 이진 분류(Binary Classification)
- 정확도(Accuracy) : 전체 샘플 중 올바르게 예측한 샘플의 비율
- 정밀도(Precision) : 양성 클래스(1)로 예측된 샘플 중 실제로 양성 클래스인 샘플의 비율
- 재현율(Recall, 민감도) : 실제 양성 클래스인 샘플 중 양성 클래스로 예측된 샘플의 비율
- F1 점수(F1 Score) : Precision과 Recall의 조화 평균 (imbalance한 데이터셋에 유용)
- AUC-ROC : 모든 가능한 분류 임계값에서 모델 성능 측정하는 그래프인 ROC 곡선 아래의 면적
- 로그 손실 (Log Loss, Cross Entropy) : 실제값(레이블)과 예측값의 차이
2. 다중 클래스 분류(Multiclass Classification)
- 정확도(Accuracy) : 전체 샘플 중 올바르게 예측한 샘플의 비율
- 다중 클래스 로그 손실(Multi-Class Log Loss)
- 마크로 평균 정밀도(Macro Averaged Precision)
- 마크로 평균 재현율(Macro Averaged Recall)
- 마크로 평균 F1 점수(Macro Averaged F1 Score)
3. 회귀(Regression)
- 평균 절대 오차(MAE, Mean Absolute Error) : 실제값과 예측값 차이의 평균
- 평균 제곱 오차(MSE, Mean Squared Error) : 실제값과 예측값 차이 제곱의 평균
- 루트 평균 제곱 오차(RMSE, Root Mean Squared Error) : 실제값과 예측값 차이 제곱 평균의 제곱근
- 결정 계수(R², R-squared) : 데이터를 얼마나 잘 설명하는가?
4. 랭킹(Ranking)
- Normalized Discounted Cumulative Gain(NDCG)
- Precision at K(P@K)
- Mean Average Precision(MAP)