ML_앙상블 기법 2

조천룡·2023년 7월 28일

0

앙상블 기법

부스팅의 개요

Machine Learning

목록 보기

19/26

앙상블 기법

앙상블은 전통적으로 Voting, Bagging, Boosting, Staging 등으로 나눔
보팅과 배깅은 여러 개의 분류기가 투표를 통해 최종 예측 결과를 결정하는 방식
보팅과 배깅의 차이점은 보팅은 각각 다른 분류기, 배깅은 같은 분류기를 사용
대표적인 배깅 방식이 랜덤 포레스트

부스팅의 개요

Adaboost

step 1
step 2
step 3
step 4

부스팅 기법

Bagging = Boostrap AGGreganING

배깅과 부스팅의 차이

Wine data

pipeline이 아니라 직접 StandarScaler를 적용

Scaler 적용후 데이터 나누기

이 상태에서 cross-validation을 한다면 X_train만 대상이 된다.

모든 컬럼의 히스토그램 조사

잘 분포되어 있는 컬럼이 좋을 때가 많다.

quality 별 다른 특성이 어떤지 확인

quality에 대한 나머지 특정들의 상관관계

taste 컬럼의 분포

다양한 모델을 한번에 테스트

결과를 저장하기 위한 작업

cross-validation 결과를 확인

RandomForest가 유리해 보인다

테스트 데이터에 대한 평가 결과

10√2 Data

이전 포스트

ML_앙상블 기법 1

다음 포스트

ML_kNN

0개의 댓글

관련 채용 정보