01.14(화) 본캠프 35일차 - 로지스틱 회귀

Laña·2025년 1월 14일
0
post-thumbnail

Logistic Regression

로지스틱 회귀분석은 일반화 선형모형(Generalized Linear Model, aka.GLM)이라 불리는 범주의 통계모형 모델링 방법 중 하나
어제 공부한 선형회귀 모델이랑 비슷하지만 다른 부분이 있다.

GLM에 관한 자세한 설명
참고자료: Must Learning with R

비선형적인 모형 적합시

S자 형태를 띠는 비선형적인 회귀곡선


로짓의 개념

  • 오즈비 ; 실패확률 대비 성공확률
    오즈비(oddsratio)=P1P오즈비(odds ratio) = \frac{P}{1-P}
    예) 주사위에서 3이상의 눈이 나올 확률
  • 3이상(3,4,5,6) ; 4/6 =0.667
  • 나머지(1,2) ; 2/6 =0.333
  • 오즈비: 0.333/0.667 =0.499

BUT,오즈비는 바로 쓸 수 없음!!
=> P ; 확률 값으로 0P10≤ P ≤1 사이
P가 증가할수록 오즈비가 급격하게 증가
= 선형적이지 못하게 됨
~> log()log()활용하여 완화
Logit=log(P1P)Logit = log(\frac{P}{1-P})

로짓의 그래프가 오즈비보다 더 선형적인 그림을 나타내어 선형회귀의 기본식을 활용할 수 있음
= '로지스틱 회귀'


실습

Rule Base(룰 베이스) - 로지스틱 회귀는 아님!!




로지스틱회귀 예시 - titanic data










다중 로지스틱 회귀 예시









기타

로지스틱 회귀를 실

profile
SQL, Python, Code Kata

0개의 댓글