숫자형 + 문자형 칼럼의 중요도를 확인하기 위해서는 feature_importances_
를 사용할 수 있다.
xgb.feature_importances_
pd.Series(xgb.feature_importances_, index = train2.columns).sort_values(ascending = False)
이렇게 넣어주면 각 칼럼의 중요도를 순서대로 확인할 수 있다.
중요도가 0인 칼럼을 위에서 빼줘도, 해석을 위한 것이기 때문에 모델 점수 개선에 직접적으로 영향을 주지는 않는다!
아이디어를 생각해낼 때 사용되고, 이미 모델에서 어떤 칼럼이 중요한지 파악했기 때문에 중요하지 않은 애들은 알아서 학습을 시키지 않았다.
눈으로 확인하는 용도
모델을 돌리고 난 후 피쳐 임포턴스를 사용할 것!