크게 4가지로 분류
알고리즘 class 이름으로 검색하면 sklearn 공식 사이트에서 각 파라미터의 의미를 확인할 수 있음
패키지
데이터 준비
데이터 전처리
결측치, 이상치 감지
파생변수(통제요인-더미변수) 생성여부 결정 및 수행
독립변수/종속변수 분리
독립변수/종속변수 분리 이후
표준화 적용 여부 결정 (가급적 수행, before/after 결과 비교 권장)
훈련/검증 데이터 분할 결정 (지도학습은 거의 필수)
학습모델 구축
표준화 적용 전/후 비교
최적의 파라미터 도출