[파머완] ch4.2 Decision Tree 피처 중요도 시각화

­반소희·2022년 6월 28일
1

결정트리는 균일도에 기반하여 규칙 조건을 설정하는 모델이다. 사이킷런은 결정트리 알고리즘이 규칙을 정하는 데 있어 피처의 중요한 역할 지표를 DecisionTreeClassifier 객체의 속성으로 제공한다.

해당 속성은 ndarray 형태로 값을 반환하며, 피처 순서대로 값이 할당된다. 일반적으로 값이 높을수록 중요도가 높다는 것을 의미한다.

import seaborn as sns
import numpy as np

## feature importance 추출
print('feature importances:')
print(np.round(dt_clf.feature_importances_, 3))

## feature importance 매핑
for name, value in zip(iris_data.feature_names, dt_clf.feature_importances_):
    print(f"{name} : {value}")

## seaborn을 이용한 시각화
sns.barplot(x=dt_clf.feature_importances_, y=iris_data.feature_names)

결과는 아래와 같다. 즉, petal length feature가 가장 중요도가 높음을 알 수 있다.

profile
행복한 소히의 이것저것

0개의 댓글

관련 채용 정보