머신러닝 개념 정리 및 성능 평가

Lungnaha·2022년 3월 5일
1

끄적끄적

목록 보기
2/3

💪 들어가며...

이번에 논문 프로젝트를 진행하면서 혹시나 딥러닝을 사용할까 싶어서 미리 머신러닝에 관련된 개념을 정리하고 이를 오래 기억할 수 있도록 기록하고자 이 개념 정리 글을 작성하게 되었습니다.
물론, 프로젝트에서 사용하지 못할 수도 있지만, 기록하고 공부하는 것이 도움이 되지 않을까 싶습니다. 😚

🦽 인공지능과 기계학습

인공지능(AI)

  • 사람이 하는 것을 대신하는 모든 것!

기계학습(머신러닝)

  • 인공지능의 일부로, 인공지능에 "학습"의 개념이 들어간 것
  • 학습을 통해서 프로그램이 계속적으로 변하는 것이 가장 큰 차이점

cf) 딥러닝

  • 머신러닝의 일종으로 Deep NN(인공신경망)을 쓰는 머신러닝

🛹 성능 평가

학습의 성능을 평가하기 위해서는 다양한 지표를 활용합니다.

True Negative(TN)

  • 부정을 부정으로 예측

True Positive(TP)

  • 긍정을 긍정으로 예측

False Positive(FP)

  • 부정을 긍정으로 예측
  • Type 1 Error

False Negative(FN)

  • 긍정을 부정으로 예측
  • Type 2 Error

이를 활용해서 간단하게 Confusion Matrix 를 만들 수 있습니다.

위의 경우를 활용해서 아래와 같은 수치들로 나타낼 수 있습니다.

Accuracy(정확도)

  • 전체 데이터 중에서 바르게 예측한 경우의 비율

Precision(정밀도)

  • 긍정을 예측한 경우, 실제로 그 결과가 긍정인 경우의 비율

Recall(재현도=민감도)

  • 결과가 긍정인 경우, 이를 긍정으로 바르게 예측한 경우의 비율

Specificity(특이도)

  • 결과가 부정인 경우, 이를 부정으로 바르게 예측한 경우의 비율

FPR(False Positive Rate)

  • 결과가 부정인 경우, 이를 긍정으로 잘못 예측한 경우의 비율

위의 비율 값을 토대로 성능을 시각적으로 확인할 수 있는 그래프를 그릴 수 있습니다.

왼쪽은 PR 그래프로 x축은 재현도, y축은 정밀도로 이루어져 있습니다.
이는 FN보다 FP의 값을 중요시 여길 때 주로 사용됩니다.
해당 그래프는 ㄱ 모양으로 그래프가 가까워질수록 좋은 성능으로 평가됩니다.

오른쪽은 ROC 그래프로 x축은 FPR, y축은 재현도로 이루어져 있습니다.
이는 ㄱ 을 y축 대칭으로 한 모양과 그래프가 가까워질수록 좋은 성능으로 평가됩니다.

profile
Long🌈Now😁Happy💖

0개의 댓글