이번에 논문 프로젝트를 진행하면서 혹시나 딥러닝을 사용할까 싶어서 미리 머신러닝에 관련된 개념을 정리하고 이를 오래 기억할 수 있도록 기록하고자 이 개념 정리 글을 작성하게 되었습니다.
물론, 프로젝트에서 사용하지 못할 수도 있지만, 기록하고 공부하는 것이 도움이 되지 않을까 싶습니다. 😚
인공지능(AI)
기계학습(머신러닝)
cf) 딥러닝
학습의 성능을 평가하기 위해서는 다양한 지표를 활용합니다.
True Negative(TN)
True Positive(TP)
False Positive(FP)
False Negative(FN)
이를 활용해서 간단하게 Confusion Matrix 를 만들 수 있습니다.
위의 경우를 활용해서 아래와 같은 수치들로 나타낼 수 있습니다.
Accuracy(정확도)
Precision(정밀도)
Recall(재현도=민감도)
Specificity(특이도)
FPR(False Positive Rate)
위의 비율 값을 토대로 성능을 시각적으로 확인할 수 있는 그래프를 그릴 수 있습니다.
왼쪽은 PR 그래프로 x축은 재현도, y축은 정밀도로 이루어져 있습니다.
이는 FN보다 FP의 값을 중요시 여길 때 주로 사용됩니다.
해당 그래프는 ㄱ 모양으로 그래프가 가까워질수록 좋은 성능으로 평가됩니다.
오른쪽은 ROC 그래프로 x축은 FPR, y축은 재현도로 이루어져 있습니다.
이는 ㄱ 을 y축 대칭으로 한 모양과 그래프가 가까워질수록 좋은 성능으로 평가됩니다.