[ML] 머신러닝 - Logistic Regression

GisangLee·2022년 7월 23일
0

ML

목록 보기
71/141

범주형 데이터의 선형 회귀

  • 정답의 범위가 0과 1 사이
  • 단순 선형회귀의 예측값 범위는 마이너스 무한 ~ 플러스 무한
  • 0과 1사이를 벗어나는 예측은 예측의 정확도를 낮추게됨.
  • 예측의 결과가 0과 1사이에 있어야한다.

1. 정의

  • Linear Regression + Logistic Function
  • 범위가 0 ~ 1사이에 존재
  • 정답에 범주형일 때 사용하는 모델

Threshhold

  • 확률 값을 범주형으로 변환할 때의 기준

  • Threshhold에 따라 정확도가 달라지는 현상이 발생한다.
    즉, 평가지표로 부족할 때가 있다. 이럴 때 AUROC 지표로 보완한다.


2. ROC Curve

True Positive

  • 실제 값 1을 1로 예측한 경우

False Positive

  • 실제 값 1을 0으로 예측한 경우

True Negative

  • 실제 값 0을 1로 예측한 경우

False Negative

  • 실제 값 0을 0로 예측한 경우

  • 여러 Threshhold에 대해 TPR와 FPR을 계산한다.


3. Area Under ROC (AUROC)

  • Threshhold에 의해 값이 변하지 않는 지표

  • ROC Curve의 밑 면적 넓이


3. Multiclass Logistric Regression

One or Nothing

  • 범주가 3개 이상일 때


profile
포폴 및 이력서 : https://gisanglee.github.io/web-porfolio/

0개의 댓글