1
Decision Tree(예/아니오 질문)-의사결정나무

첫질문 - Root Node(뿌리 노드)
줄줄이뻗어나가는 질문 - Leaf Node(나뭇잎노드)
지니불순도(Gini Impurity)로 계산이된다.
- 불순도가 0이나 1일때 가장 정확하다

결정트리 과대적합 제어

장점 및 주요 매개변수(하이퍼파라미터)


단점

knn = 거리계산
DecisionTree = 불순도계산
문자데이터를 숫자데이터로 변환(인코딩) - 컬럼을 늘려야된다
- 과대적합에 영향을 끼칠수 있다.
- 순위나 크기에 영향이 간다
라벨인코딩

원핫인코딩

문제값 X대신에 X_one_hot
7:3비율 나누기

시각화

특성선택
