지니 계수

I'm Cape·2023년 7월 20일
0

그냥 별 생각 없이 배웠는데,
Decision Tree에서 나오는 개념인 듯 하다.
정보 속성에 대한 이야기니까, 데이터가 있다면 어디에든 해당되는 것이 아닌가...?

Decision Tree는 데이터를 분류하기 위한 경계선이 있는데,
그 경계선을 긋는데 Entropy나 Gini 계수가 사용되는 듯 하다.

엔트로피: 무질서한 정도
H(X)=i=1npilog2piH(X)=-\overset{n}{\underset{i=1}{\sum}}p_ilog_2p_i

지니 공식: 높을수록 클래스들이 공평하게 섞여있다
Gini=1i=1C(pi)2Gini=1-\overset{C}{\underset{i=1}{\sum}}(p_i)^2

< 참고 문헌 >
https://teddylee777.github.io/scikit-learn/scikit-learn-decision-tree-entropy-gini/

Decison Tree 그리는 부분을 코드화해야 할 것 같다

profile
Impact

2개의 댓글

comment-user-thumbnail
2023년 7월 20일

가치 있는 정보 공유해주셔서 감사합니다.

1개의 답글