confusion matrix(혼동행렬) 이란 ..?
어떤 개인이나 모델, 검사도구, 알고리즘의 진단·분류·판별·예측 능력을 평가하기 위하여 고안된 표
5개의 주요 성능 지표
혼동행렬을 설명하는 굉장히 유명한 짤 ..
- True Positive(TP) positive로 예측을 했고, 그것이 맞음.
- True Negative(TN) negative로 예측을 했지만, 그것이 맞음.
- False Positive(FP) positive로 예측을 했지만, 그것이 틀림. (TYPE 1 ERROR)
- False Negative(FN) negative로 예측을 했지만, 그것이 틀림. (TYPE 2 ERROR)
민감도 (Sensitivity) : (TP / (TP + FN)) 양성 중 맞춘 양성의 수
특이도 (Specificity) : (TN / (FP + TN)) 음성 중 맞춘 음성의 수
정밀도 (Precision) : (TP / (TP + FP)) 양성이라고 판정 한 것 중에 실제 양성 수
재현율 (Recall) : (TP / (TP + FN)) 전체 양성 수에서 검출 양성 수
정확도 (accuracy) : ((TP + TN) / (TP + FN + FP + TN)) 전체 개수 중에서 양성과 음성을 맞춘 수
Recall
- 한국말로는 재현율 (직관적으론 검출율이라고 봐도 됨)
- 검출해야하는 물체들 중에서 제대로 검출된 것의 비율
- 대상 물체들을 빠뜨리지 않고 얼마나 잘 잡아내는지를 나타냄
- 실제 positive 중 정확히 positive라고 식별된 사례의 비율
- 통계학에서는 sensitivity으로, 그리고 다른 분야에서는 hit rate 라는 용어로도 사용
from sklearn.metrics import recall_score
Precision
- 한국말로는 정밀도
- 모든 검출 결과 중 옳게 검출한 비율
- positive로 식별된 사례 중 실제 positive 사례의 비율
from sklearn.metrics import precision_score
Accuracy (ACC)