앙상블 기법
앙상블 기법
- 앙상블은 전통적으로 Voting, Bagging, Boosting, 스태깅 등으로 나눔
- 보팅과 배깅은 여러개의 분류기가 투표를 통해 최종 예측 결과를 결정하는 방식
- 보팅과 배깅의 차이점은 보팅은 각각 다른 분류기, 배깅은 같은 분류기를 사용
- 대표적인 배깅 방식이 랜덤 포레스트
Boosting 의 개요

배깅과 부스팅의 차이

Adaboost
부스팅 기법

Bagging
Bagging = Bootstrap AGGregatING

Bagging과 Boosting의 차이

실습
데이터 읽고 맛에 대한 컬럼 추가

StandardScaler를 적용 후 데이터 나누기
이 상태에서 cross-validation을 한다면 X_train만 대상

모든 컬럼의 히스토그램 조사
잘 분포되어 있는 컬럼이 좋을 때가 많다

quality 별 다른 특성이 어떤지 확인

quality에 대한 나머지 특정들의 상관관계

taste 컬럼의 분포

다양한 모델을 한 번에 테스트 후 결과 확인

cross-validation 결과
RandomForest가 유리해 보인다

테스트 데이터에 대한 평가 결과
