TIL-로지스틱회귀 실습

HJ·2024년 6월 11일

ML_TIL

목록 보기
9/13

로지스틱회귀 실습

1. 자주쓰는 함수

  • sklearn.linear_model.LogisticRegression : 로지스틱회귀 모델 클래스
    • 속성
      • classes_: 클래스(Y)의 종류
      • n_features_in_ : 들어간 독립변수(X) 개수
      • feature_names_in_: 들어간 독립변수(X)의 이름
      • coef_: 가중치
      • intercept_: 바이어스
    • 메소드
      • fit: 데이터 학습
      • predict: 데이터 예측
      • predict_proba: 데이터가 Y = 1일 확률을 예측
  • sklearn.metrics.accuracy: 정확도
  • sklearn.metrics.f1_socre: f1_score

2. 타이타닉 실습

1) 데이터 생성 및 라이브러리 설치

2) X변수 선정

  • 숫자
    • Age, Sibsp, Parch, Fare
  • 범주형
    • Pclass, Sex, Cabin, Embarked
  • X변수 1개, y변수(Survived)

3) 로지스틱회귀모델 불러오고, 데이터 훈련하기

4) 산점도 확인

  • 산점도 모양이 이상적이지 않은 것은 데이터 전처리를 하지 않았기 때문이다. 히스토그램으로 X변수의 분포를 파악해보자.

5) 히스토그램 확인

6) 기술통계 확인 후, 모델 학습

7) 매번 출력을 입력하지 않도록 함수화

8) 예측값 생성

9) 평가 : Accuracy, F-1 Score

  • 매번 결과를 보여달라고 입력하지 않아도 되도록 함수화.
profile
First time, Last time, Every time.

0개의 댓글