TIL-로지스틱회귀 정리 & 모델링 정리

HJ·2024년 6월 11일

ML_TIL

목록 보기
11/13

로지스틱회귀 정리

  • 사실상 로지스틱회귀는 선형회귀의 아이디어에서 종속 변수(Y)만 가공한 것이기 때문에 장/단점이 똑같다.
  • 로지스틱회귀
    • 장점 : 직관적이다. 이해하기 쉽다.
    • 단점 : 복잡한 비선형관계를 모델링하기 어려울 수 있다.
    • Python 패키지 : sklearn.linear_model.LogisticRegression

      ✅ 알맞은 척도 사용하여 평가하기!!

      • ex) accuracy 같은 경우, y 변수가 unbalance한 경우 사용할 수 없다.

모델링 기본 마무리

1. 회귀, 분류 정리

1) 선형회귀와 로지스틱회귀의 공통점

  • 모델 생성이 쉬움
  • 가중치(회귀계수)를 통한 해석이 쉬운 장점이 있다.
  • X변수에 범주형, 수치형 변수 둘 다 사용할 수 있다.

2) 선형회귀와 로지스틱회귀의 차이점

  • Y(종속변수)
  • 평가척도
  • sklearn 모델 클래스 & 평가 클래스

2. 전체 데이터 분석 프로세스


숫자를 예측하는 회귀분석, 범주를 맞추는 분류분석에 대해 배웠지만 세상에 있는 모든 문제를 다 해결할 수 없다. 데이터 모델링은 데이터 사이언스의 아주 일부분이며, 데이터 품질 향상을 위해 데이터 수집과 전처리에 아주 많은 시간을 투자해야 한다.

profile
First time, Last time, Every time.

0개의 댓글