어린아이에게 안전한 동영상을 걸러내는 모델을 만들어 봅시다.
- 나쁜 동영상을 음성 (0)
- 좋은 동영상을 양성 (1)
결론적으로는 ?????를 목표로 삼아야 한다.
도둑을 잡는 CCTV 모델을 만들어야 봅시다.
- 시민을 음성 ( 0 )
- 도둑을 양성 ( 1 )
결론적으로는 ?????를 목표로 삼아야 한다.
아이에게 나쁜 동영상을 보여주는 것이 안 좋은 영향을 미친다는 것을 전제로 생각해보자
실제로는 나쁜 동영상인데, 모델이 예측했을 때 좋은 동영상이라고 판단하여 아이에게 보여주는 경우가 줄어들어야 한다.
FP 값이 줄어들어야 "어린아이에게 안전한 동영상을 걸러내는 모델"이 될 수 있다.
Precision(정밀도) = TP / (FP + TP)
FP를 크리티컬한 문제라고 삼았기에 정밀도가 중요해진다.
Threshold값이 올라가야 FP값은 내려가므로 Threshold값이 1에 가까울수록 좋은 효과를 볼 수 있을 것이다.
결론적으로 FP값을 낮추기 위해 Threshold값도 1에 가까워져야 할 것으로 예상된다.
"도둑을 잡는 CCTV 모델"이라는 점을 중점적으로 생각해본다면
도둑을 시민으로 생각하는게 더 critical한 문제를 불러일으킬 것이다.
"도둑을 시민으로 생각하는게 더 critical한 문제를 불러일으킨다" 를 중점적으로 봤을 때 실제도둑을 시민으로 예측하는게 더 큰 문제라고 판단했다.
그렇다면 오차 행렬에서 FN을 Critical한 문제라고 생각한다는 것과 동일하다.
이 때, FN값이 낮아져야 도둑을 시민으로 생각하는 값의 경우의 수가 줄어들게 된다.
Recall(재현율)공식 = TP / (FN+TP)
FN을 크리티컬한 문제라고 삼았기에 재현율이 중요해진다.
Threshold값이 내려가야 FN값도 내려가므로 Threshold값은 0에 가까울수록 좋은 효과를 볼 수 있을 것이다.
결론적으로 FN값을 낮추기 위해 Threshold값도 0에 가까워져야 할 것으로 예상된다.
하지만, Threshold를 무작정 0이나 1에 가깝게 조절하는 것은 위험성이 존재한다는 사실을 기억해야 된다!