Stacking Ensemble 원리

기린이·2024년 1월 12일
0

Simple Stacking

  • 데이터를 train / val / test로 분리
  • train data로 기반모델 학습
  • 학습된 기반모델로 val data 예측해서 new_train(메타모델 학습용) 생성해서, 메타모델 학습
  • test데이터로 최종 예측 진행

CV Stacking

  • train / test 데이터 존재하는 상황에서 train데이터를 fold 수만큼 나눔
  • 각 fold별 train데이터로 학습후, val 데이터 예측치 모아둠(모두 모이면 메타모델 학습을 위한 new train이 된다.)
  • 각 fold별 train데이터로 학습된 모델로 test데이터의 예측치 모아두고, 평균내서 최종 예측치를 만든다.(new_test)
  • new train으로 메타모델 학습, new test로 메타모델 최종 예측치 산출

각 폴드의 val데이터로 메타모델 학습 데이터를 만들고, 각 폴드별로 테스트 데이터 예측을 진행하고 평균내서 메타모델의 테스트 데이터를 만든다.

스태킹 원리 이해위해선 메타모델의 인풋을 어떻게 만드는지에 집중해서, 메타모델 중심으로 생각하면 편하다.

profile
중요한 것은 속력이 아니라 방향성, 공부하며 메모를 남기는 공간입니다.

0개의 댓글