Simple Stacking
- 데이터를 train / val / test로 분리
- train data로 기반모델 학습
- 학습된 기반모델로 val data 예측해서 new_train(메타모델 학습용) 생성해서, 메타모델 학습
- test데이터로 최종 예측 진행
CV Stacking
- train / test 데이터 존재하는 상황에서 train데이터를 fold 수만큼 나눔
- 각 fold별 train데이터로 학습후, val 데이터 예측치 모아둠(모두 모이면 메타모델 학습을 위한 new train이 된다.)
- 각 fold별 train데이터로 학습된 모델로 test데이터의 예측치 모아두고, 평균내서 최종 예측치를 만든다.(new_test)
- new train으로 메타모델 학습, new test로 메타모델 최종 예측치 산출
각 폴드의 val데이터로 메타모델 학습 데이터를 만들고, 각 폴드별로 테스트 데이터 예측을 진행하고 평균내서 메타모델의 테스트 데이터를 만든다.
스태킹 원리 이해위해선 메타모델의 인풋을 어떻게 만드는지에 집중해서, 메타모델 중심으로 생각하면 편하다.