여러 전처리를 연결해 중복 코드를 최소화할 수 있게 됨
from sklearn.pipeline import make_pipeline
from sklearn.tree import DecisionTreeClassifier
지니불순도와 엔트로피 ~ 불순도 낮을수록 낮은 값
불순도 : 잘 나누어질수록 낮은 값
import graphviz
from sklearn.tree import export_graphviz
주요 하이퍼파라미터
min_samples_split : 스플릿 결과 당 최소 샘플 수 설정
min_samples_leaf : 말단 노드(external node)에 최소한 존재해야 하는 샘플들의 수
max_depth : 분기의 깊이 설정