Pipeline

JERRY·2025년 4월 2일

Machine Learning

목록 보기
6/31
post-thumbnail

Pipeline?

지금까지 내용에서 불편함은?

  • 단순히 Iris, Wine 데이터를 받아서 사용했을 뿐인데, 직접 공부하면서 코드를 하나씩 실행해보면 혼돈이 크다는 것을 알 수 있다.
  • Jupyter Notebook 상황에서 데이터의 전처리와 여러 알고리즘의 반복 실행, 하이퍼 파라미터의 튜닝 과정을 번갈아 하다 보면 코드의 실행 순서에 혼돈이 있을 수 있다.
  • 이런 경우 클래스(class)로 만들어서 진행해도 되지만, sklearn 유저에게는 꼭 그럴 필요없이 준비된 기능이 있다. → Pipeline

실습

다시 와인 데이터

레드/화이트 와인 분류기의 동작 Process

여기서 test_train_split은 Pipeline 내부가 아니다.

방금 부분의 Pipeline을 코드로 구현하면?

pipeline.steps

스텝별로 객체 호출

set_params

스탭이름 “clf” + 언더바 두 개 “- -” + 속성 이름

Pipeline을 이용한 분류기 구성

성과

모델 구조 확인

0개의 댓글