[ML/DL] 모델성능평가 F1-score

하나·2022년 2월 3일
0

ML/DL

목록 보기
6/9
post-thumbnail

사이킷런에는 모델의 성능을 평가할 수 있는 여러 다양한 라이브러리들이 존재한다. binary classification도 가능하지만 multi class 인 경우에도 파라미터를 설정하면 평가할 수 있다.

정확도 (Accuracy)

올바르게 예측된 데이터의 수를 전체 데이터의 수로 나눈 값

정밀도 (Precision)

모델이 True로 예측한 데이터 중 실제로 True인 데이터

재현율 (Recall)

모델이 True로 예측한 데이터 중 실제로 True인 데이터

F1-score

정밀도와 재현율의 조화 평균

Confusion Matrix (혼동행렬)


기계 학습 분야의 통계적 분류 같은 문제에서 컨퓨전 행렬, 이란 지도 학습으로 훈련된 분류 알고리즘의 성능을 시각화 할 수 있는 표이다. 행렬의 각 행은 예측 된 클래스의 인스턴스를 나타내며 각 열은 실제 클래스의 인스턴스를 나타낸다.
참고 : https://ko.wikipedia.org/wiki/%ED%98%BC%EB%8F%99_%ED%96%89%EB%A0%AC

정확도 : 예측이 정답과 얼마나 정확한가?
정밀도 : 예측한 것중에 정답의 비율은?
재현율 : 찾아야 할 것중에 실제로 찾은 비율은?
F1 Score : 정밀도와 재현율의 평균

F1 Score 값이 높으면 성능이 높다고 할 수 있다.

SKlearn.metics.f1_score(y_true,y_pred,labels=None, average='binary')

  • average 파라미터의 디폴트 값은 binary 이므로 muti-class 인 경우에는 average 파라미터를 설정해주어야 한다.

참고자료 : https://bhcboy100.medium.com/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-%EB%B6%84%EB%A5%98-%ED%8F%89%EA%B0%80%EC%A7%80%ED%91%9C-%EC%9D%B4%ED%95%B4%ED%95%98%EA%B8%B0-%EC%A0%95%ED%99%95%EB%8F%84-%EC%A0%95%EB%B0%80%EB%8F%84-%EC%9E%AC%ED%98%84%EC%9C%A8-f1-%EC%8A%A4%EC%BD%94%EC%96%B4-6bf91535a01a, https://hongl.tistory.com/136, https://www.google.com/search?q=confusion+matrix&rlz=1C5CHFA_enKR987KR988&sxsrf=APq-WBsE6_ixQJxaybJKklAXUcPbNyryHQ:1643908933372&tbm=isch&source=iu&ictx=1&vet=1&fir=szl_HbzO5F6VtM%252CGrBJC4kFQBCbrM%252C_%253BLuNORzXGPIRo5M%252C3AjvgvLThtFGiM%252C_%253BRCVXpCQ_lvygQM%252CoOU9FsB8hN_YUM%252C_%253BZsjKQfl8ln_CiM%252CkfSUeKAmrB4ItM%252C_%253Bggy2uWE-wP-UdM%252Cd95-0ZYZ2clH3M%252C_%253BkCd8KDPXOM_mFM%252CZ3_r6rD56QfUaM%252C_&usg=AI4_-kTTyLcZOkv1BcALvAyvWrKT6j2JPw&sa=X&ved=2ahUKEwjByJCAhuT1AhVKzIsBHc71AXQQ_h16BAggEAE#imgrc=ggy2uWE-wP-UdM

0개의 댓글