머신러닝에서는 맞춘 문제/전체 문제=정확도 라고 하는데, 이 정확도만 가지고는 맞춘 문제와 틀린 문제의 세부사항을 알 수가 없다. 세부 사항을 알아야 틀린 문제의 원인을 파악하고 수정을 할 수 있는데, 정확도만 갖고는 판단을 할 수 없으니 혼동 행렬이라는 개념을 사용한다.
True Positive(TP) : 실제 True인 정답을 True라고 예측 (정답)
False Positive(FP) : 실제 False인 정답을 True라고 예측 (오답)
False Negative(FN) : 실제 True인 정답을 False라고 예측 (오답)
True Negative(TN) : 실제 False인 정답을 False라고 예측 (정답)
1) 정밀도(Precision)
정밀도란 모델이 True라고 분류한 것 중에서 실제 True인 것의 비율을 뜻한다.
2) 재현율(Recall), 위 표에서는 민감도에 해당
재현율이란 실제 True인 것 중에서 모델이 True라고 예측한 것의 비율을 뜻한다.
Precision이나 Recall은 모두 실제 True인 정답을 모델이 True라고 예측한 경우. 즉, TP에 관심이 있다는 것을 알 수 있다.
3) 정확도(Accuracy)
정확도는 우리가 일반적으로 실생활에서도 가장 많이 사용하는 지표로서 전체 예측한 데이터 중에서 정답을 맞춘 것에 대한 비율을 뜻한다.
4)특이도(Specificity)
특이도란 실제 False인 것 중에서 False라고 예측한 것의 비율로서 위키독스에 언급하지 않은 것을 보아하니 머신러닝에선 그다지 중요한 요소는 아닌 듯 하다.