[파이썬 머신러닝 완벽가이드] 분류 - 2

박기정·2021년 1월 10일
0

분류 알고리즘


결정트리

지난 번에 이어서 결정트리 모델의 특징에 대해서 알아보겠습니다.

결정트리 모델의 특징

장점

결정모델의 장점은 쉽고 직관적이라는 점 입니다. 룰이 명확하고 시각화로 표현까지 가능합니다. 또한 균일도만 신경쓰면 각 피처의 스케일링과 정규화 같은 전처리 작업의 영향도가 크지 않습니다.

단점

단점으로는 과적합으로 정확도가 떨어집니다. 이를 위해서 트리의 크기를 사전에 제한하는 튜닝이 필요합니다. 과적합에 대해서는 조금 이따가 다뤄보도록 합니다.

결정 트리 파라미터

결정트리 파라미터로는

  • min_sample_split
    노드를 분할하기 위한 최소한의 샘플 데이터 수 설정
    충족이 안되면 분할하지 않습니다.
  • min_sample_leaf
    말단 노드가 되기 위한 최소한의 샘플 데이터 수
    분류를 할때 leaf의 샘플 수가 충족되도록 상황을 반영하여 리프노드를 생성합니다.
  • max_features
    최적의 분할을 위해 고려할 최대 피처 개수
  • max_depth
    트리의 최대 깊이를 규정
  • max_leaf_nodes
    말단 노드의 최대 개수

이렇게 파라미터를 사용할 수 있습니다.

0개의 댓글