Classification model의 성능평가

Flash·2022년 5월 9일

머신러닝

목록 보기

8/8

분류 모델에는 다양한 것들이 있다.

Perceptron, SVM, Decision Tree, Bayesian 등이 그 예시이다.
이런 모델들을 개발했을 때 해당 모델의 성능을 평가하는 척도를 제시한다.

기억 안날 때 보고 참고하려고 이곳에 작성한다...

위의 이미지는 Confusion Matrix이다.

각 지점에 대한 설명을 보태면

True/False는 모델이 잘 분류했는 지를 의미하고 Positivie/Negative는 분류를 어떻게 했는 지를 의미한다.

솔직히 볼 때 마다 헷갈리긴 해서 매번 다시 찾아보고 생각한다.

정밀도는 분류 모델이 True로 분류한 것들 중에서 실제로 True인 정도를 의미한다.

Precision = TP/(TP+FP) 로 표현할 수 있고 이 값은 높으면 높을 수록 좋은 값이다.

정확도는 전체 데이터에서 모델이 올바르게 분류한 경우를 의미한다.

Accuracy = (TP+TN)/(TP+FN+FP+TN)로 표현할 수 있고 이 값은 높으면 높을 수록 좋은 값이다.

재현율은 분류 모델이 실제 True 중에서 True라고 분류한 경우를 의미한다.

Recall = TP/(TP+FN) 로 표현할 수 있고 이 값도 역시 높으면 높을 수록 좋은 값이다.

Whiplash We Flash