Boosting Algorithm

JERRY·2025년 4월 19일
0

Machine Learning

목록 보기
17/31
post-thumbnail

앙상블 기법

앙상블 기법

  • 앙상블은 전통적으로 Voting, Bagging, Boosting, 스태깅 등으로 나눔
  • 보팅과 배깅은 여러개의 분류기가 투표를 통해 최종 예측 결과를 결정하는 방식
  • 보팅과 배깅의 차이점은 보팅은 각각 다른 분류기, 배깅은 같은 분류기를 사용
  • 대표적인 배깅 방식이 랜덤 포레스트

Boosting 의 개요

배깅과 부스팅의 차이

Adaboost

  • STEP1
  • STEP2
  • STEP3
  • STEP4

부스팅 기법

Bagging

Bagging = Bootstrap AGGregatING

Bagging과 Boosting의 차이

실습

데이터 읽고 맛에 대한 컬럼 추가

StandardScaler를 적용 후 데이터 나누기

이 상태에서 cross-validation을 한다면 X_train만 대상

모든 컬럼의 히스토그램 조사

잘 분포되어 있는 컬럼이 좋을 때가 많다

quality 별 다른 특성이 어떤지 확인

quality에 대한 나머지 특정들의 상관관계

taste 컬럼의 분포

다양한 모델을 한 번에 테스트 후 결과 확인

cross-validation 결과

RandomForest가 유리해 보인다

테스트 데이터에 대한 평가 결과

0개의 댓글