โ
Accuracy (์ ํ๋)
์ ํ๋๋ ๋ชจ๋ธ์ด ์ ์ฒด ์์ธก ์ค ์ผ๋ง๋ ๋ง์ด ๋ง์ท๋์ง๋ฅผ ๋ํ๋ด๋ ์งํ์
๋๋ค.
- ์ ์:
Accuracy = (TP + TN) / (TP + TN + FP + FN)
๐ ๊ด๋ จ ์ฉ์ด ์ ๋ฆฌ
| (์ค์ ) ์์ฑ | (์ค์ ) ์์ฑ |
|---|
| (์์ธก) ์์ฑ | TP | FP |
| (์์ธก) ์์ฑ | FN | TN |
- TN (True Negative): ์ค์ ๋ก ๊ฑฐ์ง์ด๊ณ ์์ธก๋ ๊ฑฐ์ง
- FP (False Positive): ์ค์ ๋ก ๊ฑฐ์ง์ธ๋ฐ ์์ธก์ ์ฐธ
- FN (False Negative): ์ค์ ๋ก ์ฐธ์ธ๋ฐ ์์ธก์ ๊ฑฐ์ง
- TP (True Positive): ์ค์ ๋ก ์ฐธ์ด๊ณ ์์ธก๋ ์ฐธ
๐๋ง์ท์ผ๋ฉด true, ํ๋ ธ์ผ๋ฉด false / ์์ฑ์ผ๋ก ์์ธกํ์ผ๋ฉด positive, ์์ฑ์ผ๋ก ์์ธกํ์ผ๋ฉด negative
- ๋ฏผ๊ฐ๋ (Sensitivity, TPR, Recall): ์ค์ ์์ฑ์ ์์ฑ์ผ๋ก ์์ธกํ ๋น์จ, TP / (TP + FN)
- ํน์ด๋(Specificity, TNR, True Negative rate): ์ค์ Negative(์์ฑ)์ Negative(์์ฑ)์ด๋ผ๊ณ ์์ธกํ๋ ๋น์จ
- ROC Curve : FPR vs TPR ๊ทธ๋ํ
- FPR (False Positive Rate) = = FP / (FP + TN) = 1-specificity
-> ์ค์ ์์ฑ์ ์์ฑ์ผ๋ก ์์ธกํ ๋น์จ
- AUC : ROC ๊ณก์ ์๋ ๋ฉด์ (์ฑ๋ฅ ์ข
ํฉ ์งํ)
- F1-Score = 2 (Precision Recall) / (Precision + Recall)
-> Precision(์ ๋ฐ๋)์ Recall(์ฌํ์จ)์ ์กฐํํ๊ท ๊ฐ
-> Precision ๋๋ Recall ์ค ํ๋๊ฐ ๋ฎ์ผ๋ฉด F1๋ ๋ฎ์์ง
๐ ROC Curve๋?

์ด๋ฏธ์ง ์ถ์ฒ: https://bioinformaticsandme.tistory.com/328
- ๊ฐ๋ก์ถ (x์ถ): False Positive Rate (FPR)
- ์ธ๋ก์ถ (y์ถ): True Positive Rate (TPR)
- ๋ชจ๋ธ์ threshold(์๊ณ๊ฐ) ๋ฅผ ๋ณํ์ํค๋ฉด์ FPR๊ณผ TPR์ ๊ทธ๋ฆฐ ๊ณก์
- ์ข์ ๋ชจ๋ธ์ผ์๋ก ROC ๊ณก์ ์ด ์ผ์ชฝ ์ ๋ชจ์๋ฆฌ์ ๊ฐ๊น์
๐ท AUC๋?

์ด๋ฏธ์ง ์ถ์ฒ: https://angeloyeo.github.io/2020/08/05/ROC.html
AUC(Area Under the ROC Curve)๋ ROC Curve ์๋ ๋ฉด์ ์ ์๋ฏธํจ
๐ง AUC์ ํด์
| AUC ๊ฐ | ์๋ฏธ |
|---|
| 1.0 | ์๋ฒฝํ ๋ถ๋ฅ๊ธฐ (๋ชจ๋ ์ํ์ 100% ์ ํํ๊ฒ ๋ถ๋ฅ) |
| 0.9~1.0 | ๋งค์ฐ ์ข์ ๋ถ๋ฅ๊ธฐ |
| 0.7~0.9 | ๊ด์ฐฎ์ ๋ถ๋ฅ๊ธฐ |
| 0.5 | ๋ฌด์์ ์ถ์ธก๊ณผ ๋์ผ (๋๋ค guessing ์์ค) |
| < 0.5 | ์์ธก์ด ์คํ๋ ค ๋ฐ๋๋ก ์๋ (๋์ ๋ถ๋ฅ๊ธฐ) |
์๋ฅผ ๋ค์ด AUC = 0.85๋ผ๋ ๊ฑด,
๋ฌด์์๋ก ๋ฝ์ ์์ฑ ์ํ์ด ์์ฑ ์ํ๋ณด๋ค ๋ ๋์ ํ๋ฅ ๋ก "์์ฑ"์ด๋ผ๊ณ ๋ถ๋ฅ๋ ๊ฐ๋ฅ์ฑ์ด 85% ๋ผ๋ ๋ป
โ
AUC์ ์ฅ์
- ํด๋์ค ๋ถ๊ท ํ ๋ฌธ์ ์ ์๋์ ์ผ๋ก ๊ฐํจ
- ์ฌ๋ฌ threshold์ ๋ํด ์ข
ํฉ์ ์ธ ๋ถ๋ฅ ์ฑ๋ฅ์ ํ๊ฐํ ์ ์์
- Precision, Recall, Accuracy๋ง์ผ๋ก๋ ์๊ธฐ ์ด๋ ค์ด ๋ชจ๋ธ์ ์ ์ฒด์ ์ธ ๋ถ๋ฅ ๋ฅ๋ ฅ์ ํ์
ํ ์ ์์