[머신러닝] 결정 트리(Decision Tree)

조세은·2022년 10월 31일
0

머신러닝

목록 보기
2/2

Python Machine Learning 책으로 공부했음을 밝힙니다.

결정 트리는 분류(classification)와 회귀(regression)가 가능한 지도 학습 모델이다.

스무고개처럼 예/아니오 질문을 하며 학습한다.

훈련 데이터에 있는 특성을 기반으로 샘플의 클래스 레이블을 추정할 수 있는 일련의 질문을 학습한다.

트리의 루트(root)에서 시작해서 정보 이득(imformation Gain, IG)이 최대가 되는 특성으로 데이터를 나눈다.

반복되는 과정을 통해 리프 노드(leaf node)가 순수해질 때까지 모든 지식 노드에서 이 분할 작업을 반복한다. 즉, 각 노드의 모든 훈련 샘플은 동일한 클래스에 속한다.
실제로 이렇게 하면 노드가 많은 깊은 트리가 만들어지고 과대적합될 가능성이 높다. 일반적으로 트리의 최대 깊이를 제한하여 트리를 가지치기(pruning)한다.

profile
학부생 3학년

0개의 댓글

관련 채용 정보