Confusion Matrix에서 Recall에 대해 설명드리겠습니다.
Recall의 정의
Recall은 실제 Positive인 것들 중에서 모델이 Positive로 정확히 예측한 비율입니다.
공식:
Recall = TP / (TP + FN)
- TP (True Positive): 실제 Positive를 Positive로 예측
- FN (False Negative): 실제 Positive를 Negative로 예측 (놓친 것)
왜 필요한가?
Recall은 "실제 양성 케이스를 얼마나 잘 찾아내는가"를 측정합니다.
중요한 경우:
- 암 진단: 암 환자를 놓치면 안 됨
- 사기 탐지: 실제 사기를 놓치면 큰 손실
- 스팸 필터링: 중요한 메일이 스팸으로 분류되면 안 됨
즉, "놓치면 안 되는 상황"에서 특히 중요합니다.
왜 "Recall"이라고 부르나?
맞습니다! Recall의 기본 뜻은 "회수하다, 떠올리다, 소환하다"입니다.
명명 이유:
- "회수하다"의 의미로, 실제 존재하는 모든 Positive 케이스를 얼마나 많이 회수(찾아냈는지)를 나타냅니다
- 정보 검색(Information Retrieval) 분야에서 유래했는데, "검색 시스템이 관련된 문서들을 얼마나 많이 불러왔는가(recall)"를 측정하는 지표였습니다
비유:
바다에 100개의 진주가 있다면, 그 중 몇 개를 회수(recall)했는가?
- 80개를 찾았다면 → Recall = 80%
- 20개를 놓쳤다면 → 그만큼 Recall이 낮음
다른 이름들
Recall은 다음과 같이도 불립니다:
- Sensitivity (민감도): 의학 분야에서 주로 사용
- True Positive Rate (TPR): 통계학에서 사용
- 적중률: 한국어 번역
모두 같은 개념이지만, 분야마다 선호하는 용어가 다릅니다.