[ML] 6주차-4 : Handling Skewed Data

k_dah·2021년 11월 25일

MachineLearning_AndrewNg

목록 보기

14/32

Machine Learning by professor Andrew Ng in Coursera

1) Error Metrics for Skewed Classes

Cancer classification example

logistic regression모델을 훈련시켰더니 에러율이 1%밖에 되지 않았다.
즉 99%의 정확도를 가진다는 것이다.
하지만 이때 0.5%만이 암환자 였다면?
애초에 암환자의 비율이 상대적으로 적었기 때문에 에러율은 낮을 수 밖에 없었던 것이다.
이런 경우를 skewed classes라고 한다.
'정확도는 매우 높고 에러율은 작을 수 밖에 없다.'
적절한 성능 측정 지표가 필요하다.