1탄 없이 2탄먼저 올림
2탄에선
회귀 트리를 이용해 회귀 모델 만들고 개별 회귀 모델의 예측 결괏값을 혼합해 최종 회귀 값 예측할 것이다.
LightGBM의 경우 설치를 먼저 진행했다.
LightBGM이 작동은 되는데, 뭔가 문제가 있는 것 같다. 해결중
암튼 LightGBM 적용 시 5폴드 세트 평균 RMSE 0.1166인 것을 확인했다.
릿지 예측값에 0.4를 곱하고 라쏘 모델 예측값에 0.6을 곱한 뒤 더했다.(성능이 더 좋았던 곳에 가중치를 뒀다.)
최종 혼합 모델의 RMSE가 개별 모델보다 더 개선된 걸 확인 가능함.
통상적으로 최종 혼합 모델의 성능이 더 우수해야 하지만 현재 내 LightBGM에 문제가 있어 느리게 나온 것 같다.
이제 get_stacking_base_datasets()를 모델별로 적용해 메타 모델이 사용할 학습 피처 데이터 세트와 테스트 피처 데이터 세트 추출함.
릿지, 라쏘, XGBoost, LightGBM 다 이용할거임
이제 각 모델이 반환한 학습용 피처 데이터와 테스트용 피처 데이터 세트를 결합한 최종 메타 모델 적용함.
메타 모델은 별도의 라쏘 모델 이용