Feature Importance

구국원·2020년 5월 18일
0

Gini Impurity

Gini Impurity를 구하는 공식은 다음과 같다. (단, k는 해당 노드에서의 유니크한 클래스의 개수, PiP_{i}는 해당 노드에서의 ii 클래스의 확률)

Gini Impurity=ikPi(1Pi)Gini \space Impurity=\sum_{i}^{k}P_{i}(1-P_{i})

Gini Importance(Mean Decrease Gini, MDG)

해당 feature로 감소시킨 gini impurity의 모든 tree의 평균

profile
All About Data Science

0개의 댓글