분류 모델의 성능을 측정하는 지표

HA_·2024년 2월 4일

분류 모델

  • 분류 모델은 머신러닝과 딥러닝 모두에서 사용될 수 있음.
  • 이 두 가지는 기본적으로 다른 방식으로 데이터를 학습하고 예측하는 방법을 나타냄.
  1. 머신러닝
  • 머신러닝은 전통적인 통계적 기법을 기반으로 한 방법론
  • 데이터에서 규칙과 패턴을 학습하여 모델을 생성
    - 분류 모델은 주로 결정 트리, 랜덤 포레스트, 서포트 벡터 머신 (SVM), 나이브 베이즈, k-최근접 이웃 (k-NN) 등의 알고리즘을 사용할 수 있음.
  1. 딥러닝
  • 딥러닝은 인공 신경망을 사용하여 특징을 자동으로 학습하고 표현하는 방법론
  • 심층 신경망, 특히 인공 신경망의 여러 층을 쌓아 학습하는 딥러닝 모델은 이미지 분류, 음성 인식, 자연어 처리 등 다양한 분야에서 효과적으로 사용됨.

분류 모델의 성능을 측정하는 여러 지표

1. Precision 정밀도

  • Precision은 모델이 양성으로 예측한 것 중에서 실제로 양성인 비율
    강의 설명)
    내가 0이라고 예측한 것 중에 실제 0일 확률
    내가 1이라고 예측한 것 중에 실제 1일 확률

2. Recall 재현율 또는 민감도

  • 실제 양성 중에서 모델이 양성으로 예측한 비율
    강의 설명)
    실제 0 중에서 0을 맞춘 확률
    실제 1 중에서 1을 맞춘 확률

3. F1-Score

  • Precision과 Recall의 조화 평균으로, 두 지표 간의 균형을 제공
    강의 설명)
    각각에 대한 프리시전(Precision)

4. Support

  • Support는 각 클래스의 실제 관측치 수를 나타냄.
  • 예를 들어, 분류 모델이 클래스 A에 대해 100개의 샘플을 맞췄으면, 그 클래스의 Support는 100임.

1. Precision (정밀도)

Precision은 모델이 양성으로 예측한 것 중에서 실제로 양성인 비율을 나타냅니다.
Precision = TP / (TP + FP)
TP는 True Positive(진짜 양성), FP는 False Positive(거짓 양성)를 나타냅니다.

2. Recall (재현율 또는 민감도)

Recall은 실제 양성 중에서 모델이 양성으로 예측한 비율을 나타냅니다.
Recall = TP / (TP + FN)
TP는 True Positive(진짜 양성), FN은 False Negative(거짓 음성)를 나타냅니다.

3. F1-Score

F1-Score는 Precision과 Recall의 조화 평균으로, 두 지표 간의 균형을 제공합니다.
F1-Score = 2 (Precision Recall) / (Precision + Recall)

4. Support

Support는 각 클래스의 실제 관측치 수를 나타냅니다.
예를 들어, 분류 모델이 클래스 A에 대해 100개의 샘플을 맞췄으면, 그 클래스의 Support는 100입니다.
이러한 지표들은 주로 분류 모델의 성능을 종합적으로 평가하는 데 사용되며, 특히 불균형한 클래스 분포를 갖는 데이터셋에서 유용합니다.

0개의 댓글