머신러닝 4일차

정준호·2022년 5월 3일

머신러닝

목록 보기
3/12

1

Decision Tree(예/아니오 질문)-의사결정나무


첫질문 - Root Node(뿌리 노드)
줄줄이뻗어나가는 질문 - Leaf Node(나뭇잎노드)
지니불순도(Gini Impurity)로 계산이된다.

  • 불순도가 0이나 1일때 가장 정확하다

결정트리 과대적합 제어

장점 및 주요 매개변수(하이퍼파라미터)


단점


knn = 거리계산
DecisionTree = 불순도계산

문자데이터를 숫자데이터로 변환(인코딩) - 컬럼을 늘려야된다

  • 과대적합에 영향을 끼칠수 있다.
  • 순위나 크기에 영향이 간다

라벨인코딩

원핫인코딩


문제값 X대신에 X_one_hot

7:3비율 나누기

시각화

특성선택

profile
파이팅

0개의 댓글