

알고리즘이 똑같음.


하드 보팅
소프트 보팅
확률의 평균을 구해서 높은 값을 선택함.
아래 예시는 1이 나올 3가지 확률의 평균은 0.7인데 이 경우 다수결로 1이 많으므로 1을 선택함.
랜덤포레스트
- bagging 기법의 투표 방식임.
 - DecisionTree 여러개를 사용해서 투표하는 방식.
 - 굉장히 빠름
 







이런 내용들이 있다 파악용.
.values, .tolist 활용






최적의 max_depth = 8

max_depth 별로 성능 정리
![]()

DecisionTree가 엄청 많이 적용된 것.
from sklearn.ensemble import RandomForestClassifier





영향력이 높은 feature들만 추려내서 20개만 가져옴.


561개의 특성보다 20개의 특성만 가지고 판단을 한다면 속도는 더 빠를 것이다.(accuracy는 조금 떨어지더라도)
