[인공지능] 로지스틱 회귀(Logistic Regression)

SeoTae·2022년 10월 26일
0

인공지능

목록 보기
8/18
post-thumbnail

회귀 분석

  • 둘 이상의 변수 간의 관계를 보여주는 통계적 방법

로지스틱 회귀

  • 회귀를 사용하여 데이터가 어떤 범주에 속할 확률을 0에서 1 사이의 값으로 예측학고 그 확률에 따라 가능성이 더 높은 범주에 속하는 것으로 분류해주는 지도 학습 알고리즘
  • 어떤 사건(event)이 발생할지에 대한 직접 예측이 아니라 그 사건이 발생할 확률을 예측하는 것
  • 종속변수가 명목변수일 때 사용됨.

명목 변수란, 측정대상의 특서을 분류(구분)하기 위한 변수이다. -> 명목변수의 숫자는 오로지 구분만을 위해 사용될 뿐, 숫자 자체에는 크기나 의미는 없음. 예로는 선수들의 등번호가 있다.

Example

  1. 수신한 메일이 스팸메일일 확률이 50% 이상이면 스팸메일함으로, 그렇지 않으면 받은 편지함으로 보냄.
  2. 금융 : 고객 신용도 평가(우량/불량)
  3. 통신 : 고객 지속 평가(유지/번호이동)
  4. 제과점 : 제과 판매(판매/폐기)
  5. 의학 : 질병 예측(간경화 유/무)

회귀의 모형

  • 반응변수가 범주형 자료(이항/다항)이며, 일반화 선형모형(Generalized Linear model)의 특수한 경우로 S형 곡선을 그리는 함수 모형
  • 종속변수 : 이분형(0 or 1의 값을 가짐)
  • 독립변수 : 범주형 or 연속형
  • 확률이 0.5보다 크면 그 사건이 일어나며, 0.5보다 작으면 그 사건이 일어나지 않는 것으로 예측
    선형회귀(왼쪽), 로지스틱 회귀(오른쪽)
profile
Vamos🔥🔥🔥🔥🔥

0개의 댓글