input data 를 사전에 미리 정해놓은
지도학습 중 하나이다,
예시)
< ML >
< DL >
< etc >
활용사례)
모델의 성능평가를 하는 이유
실제값과 예측값의 차이(=오차) 를 구하여 모델이 얼마나 예측을 잘 했는지 알아보기 위해
정답지가 필요하므로 답이 있는 지도학습에서만 성능평가를 할 수 있다.
| 실제/예측 | 예측 : Positive(O) | 예측 : Negative(X) |
|---|---|---|
| 실제 : Positive(O) | True Positive(예측 :O / 실제 : O ) | False Negative (예측 :X / 실제 : O) |
| 실제 : Negative(X) | False Positive(예측 :O / 실제 : X) | True Negative (예측 :X / 실제 : X ) |
True Positive
: 실제 양성인것을 양성으로 예측
eg) 실제 질병이 있는 사람이 질병이 있다고 예측
False Positive
: 실제 음성인것을 양성으로 잘못 예측
eg) 질병이 없는 사람을 질병이 있다고 예측
False Negative
: 실제 양성인것을 음성으로 잘못 예측
eg) 질병이 있는 사람을 질병이 없다고 예측
True Negative
: 실제 음성인것을 음성으로 예측
eg) 질병이 없는 사람을 질병이 없다고 예측
: 실제데이터가 예측 데이터와 얼마나 같은지 판단
얼마나 정확하게 예측했는가
데이터가 불균형 하지 않을때 사용(불균형 데이터에서는 과대평가의 가능성이 있다)

정확하게 예측한 데이터 \ 전체데이터
: 양성으로 분류한 데이터 중 실제 양성인 데이터 / 양성으로 분류한 데이터
False Positive(FP/예측 O 실제 X) 를 줄이는게 중요할때 사용
(잘못된 탐지)
eg) 스팸 메일 필터링, 금융사기 탐지

: 양성으로 분류한 데이터 중 실제 양성인 데이터 / 실제 양성인 데이터
False Negative(FN/예측 X 실제 O)를 줄이는 것이 중요할때 사용
(누락)
eg) 질병진단, 침입탐지

: 정밀도와 재현율의 조화평균
정밀도와 재현율을 조화평균을 사용하여 균형있는 평가 제공
불균형 데이터의 경우 효과적으로 평가 가능
정밀도와 재현율간 균형이 중요할때 사용
한쪽 지표가 극단적으로 낮으면 낮아진다
조화평균이란?

a = 정밀도 b = 재현율
