
(자료: Wikipedia)
F-Score
여기서
- TP = True Positive (정답을 맞춘 경우)
- FP = False Positive (틀렸는데 맞다고 한 경우)
- FN = False Negative (맞는데 틀렸다고 한 경우)
F1-Score$
Balanced F-measure
F1 정의
- F1은 Precision과 Recall을 동일하게 중요하게 취급한다.
- F1은 Precision과 Recall의 조화평균 (harmonic mean)으로 정의한다:
F1=2⋅Precision+RecallPrecision⋅Recall
- 산술평균(Arithmetic mean)은 단순 평균인데,
- 조화평균(Harmonic mean)은 두 값이 모두 크지 않으면 값이 작아 진다.
즉, F1은 Precision과 Recall이 둘 다 높아야 높은 값을 가질 수 있고, 한쪽이라도 낮으면 크게 깎인다.
이를 TP, FP, FN으로 바꿔 쓰면:
F1=2TP+FP+FN2TP
Fβ-Score
Generalized F-measure
Fβ-Score
Fβ=(β2⋅Precision)+Recall(1+β2)⋅Precision⋅Recall
- β > 1 이면 Recall 쪽 가중치 ↑ (Recall을 더 중요시)
- β < 1 이면 Precision 쪽 가중치 ↑ (Precision을 더 중요시)
- β = 1 이면 F1이 됩니다.
- F1: Precision과 Recall을 균형 있게 평가.
- Fβ-Score: Precision과 Recall 중 어느 쪽을 더 강조할지 β로 조절.
예시
간단 예시
- β = 2 → Recall을 Precision보다 2배 중요하게 본다.
정밀도 가중
- β = 0.5 → Precision을 Recall보다 2배 중요하게 본다.
재현율 가중
Precision이 더 높은 경우
가정:
- TP=80, FP=20, FN=40
- Precision =80+2080=0.8000
- Recall =80+4080=0.6667
계산
F1=P+R2PR=0.8+0.66672⋅0.8⋅0.6667≈0.7273
F0.5=0.52P+R(1+0.52)PR≈0.7692
F2=22P+R(1+22)PR≈0.6897
해석:
- Precision이 높은 상황이라 F0.5가 가장 높고, Recall을 중시하는 F2는 상대적으로 낮아짐.
Recall이 더 높은 경우
가정:
- TP=50, FP=50, FN=10
- Precision =50+5050=0.5000
- Recall =50+1050=0.8333
계산:
- F1 ≈0.6250
- F0.5 (정밀도 가중) ≈0.5435
- F2 (재현율 가중) ≈0.7353
해석:
- Recall이 높은 상황이라 **F2**가 가장 유리하게 나옴. 반대로 정밀도 쪽을 강조하는 F0.5는 낮아짐.
핵심 포인트 요약
- F1: Precision과 Recall을 동일 가중으로 결합 → 둘 중 하나라도 낮으면 크게 깎임.
- Fβ: β>1이면 Recall을, β<1이면 Precision을 더 중요하게 반영.
https://en.wikipedia.org/wiki/F-score