정밀도(precision) 과 재현율(recall)

양승민·2022년 1월 15일
0

머신러닝

목록 보기
2/2

정밀도(precision) : Positive 로 예측한 값 중 실제값도 Positive 인 비율
재현율(recall) : 실제값이 Positive 인 것 중에 예측값도 Positive 인 비율

precision = TPTP+FP\frac{TP}{TP +FP}
recall = TPTP+FN\frac{TP}{TP +FN}

정밀도와 재현율이 1에 가까워질수록 좋지만, 정밀도와 재현율은 trade-off 관계이다.

즉, 두 값을 따로 보지 않고 같이 고려해야한다.

재현율을 올리기 위해, 
Positive 로 판단하는 기준을 낮춰 Positive 로 판단할 확률을 높아진다. (FN 값이 낮아짐) 
하지만 Negative 도 Positive 로 판단하기도 쉬워짐(FP가 증가함)을 의미한다.
결국, 정밀도의 값이 줄어든다.  

상황에 따라 어디에 더 초점을 맞춰서 고려할지 생각해야 한다.
예측을 더 잘하고 싶다면(잘못된 예측을 줄이고 싶다면) 정밀도에 좀 더 초점을 둬야한다.
실제 Positive 인 데이터를 Positive 로 예측하고 싶다면 재현율에 좀 더 초점을 둬야한다.

이러한 정밀도와 재현율의 trade-off 를 고려한 것이 F-Score 이다.

현재 정밀도와 재현율은 TP를 분자로써 공유하기 때문에, 조화평균으로 고려해볼 수 있다.

조화평균에 대한 예시로 '동일한 거리를 다른 속력으로 이동할 때, 평균속력은 무엇인가?' 가 있다.
이 때, 동일한 거리에 대해서 시간의 영향성을 고려한다.
재현율과 정밀도도 유사하게 생각해보면 동일한 TP 에 대해서 (TP +FP) 와 (TP+ FN) 를 고려하는 것으로 볼 수 있다.
즉, 재현율과 정밀도를 조화평균을 사용하여 둘 사이의 관계를 나타내는 평균값을 구할 수 있다.
이제 이 값을 이용해서 재현율, 정밀도 바뀌어도 이전 값과 비교를 할 수 있게 되었다.

도형으로 생각해보면 아래의 노란선이 조화평균입니다.
(재현율과 정밀도 값이, 지름(재현율+정밀도)를 공유하고 있습니다.)

profile
틈틈히 공부 홀릭

0개의 댓글