Day98

김재현·2023년 10월 18일

JUPYTER/DL/ML

목록 보기
65/73

sklearn으로 제공하는 알고리즘(내장 class)

크게 4가지로 분류

  • classifier (분류)
  • regressor (회귀)
  • cluster (군집)
  • transformer (데이터 변형 : 전처리)

알고리즘 class 이름으로 검색하면 sklearn 공식 사이트에서 각 파라미터의 의미를 확인할 수 있음


지도학습 개발 단계

  1. 패키지

  2. 데이터 준비

  3. 데이터 전처리

    결측치, 이상치 감지
    파생변수(통제요인-더미변수) 생성여부 결정 및 수행
    독립변수/종속변수 분리

  4. 독립변수/종속변수 분리 이후

    표준화 적용 여부 결정 (가급적 수행, before/after 결과 비교 권장)
    훈련/검증 데이터 분할 결정 (지도학습은 거의 필수)

  5. 학습모델 구축

    표준화 적용 전/후 비교

  6. 최적의 파라미터 도출


0개의 댓글