์ฌ๋ฌ ๊ฐ์ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ(์ฝํ ํ์ต๊ธฐ)์ ๊ฒฐํฉํด ๋ ์ข์ ์ฑ๋ฅ์ ์ป๋ ๊ธฐ๋ฒ
โ๏ธ ์์๋ธ ๊ธฐ๋ฒ:
Bagging: ๋ณ๋ ฌ์ ์ผ๋ก ํ์ต(์: ๋๋คํฌ๋ ์คํธ) / *๋ถํธ์คํธ๋ฉ ์ง๊ณํ์ฌ ํ์ต๋ฐ์ดํฐ๊ฐ ์ถฉ๋ถํ์ง ์๋๋ผ๋ ํ์ตํจ๊ณผ๊ฐ ๋์
Boosting: ์์ฐจ์ ์ผ๋ก ํ์ต (์ด์ ๋ถ๋ฅ๊ธฐ์ ํ์ต ๊ฒฐ๊ณผ๋ฅผ ํ ๋๋ก, ๋ค์ ๋ถ๋ฅ๊ธฐ์ ํ์ต ๋ฐ์ดํฐ ์ํ ๊ฐ์ค์น๋ฅผ ์กฐ์ ํด ํ์ต์ ์งํํจ) / ์ค๋ต์ ๋ํด ๋์ ๊ฐ์ค์น๋ฅผ ๋ถ์ฌํ๋ฏ๋ก ์ ํ๋๊ฐ ๋์. ๊ทธ๋ฌ๋ ์ด์์น์ ์ฝํจ (์: XGBoost, AdaBoost, GradientBoost)
Stacking: ํฌ๋ก์ค ๋ฒจ๋ฆฌ๋ฐ์ด์ (Cross Validation)์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ์ชผ๊ฐฌ. Base Learner๋ค์ 10-fold CV๋ฅผ ํด ์๋ณธ ๋ฐ์ดํฐ๋ฅผ ๊ฐ fold๋ณ๋ก ์ชผ๊ฐ์ด ํ์ตํจ. ์ด ๊ฒฐ๊ณผ๊ฐ๊ณผ ์์ธก๊ฐ์ ํ๊ท ์ meta ๋ชจ๋ธ์ ์ฌ์ฉ -> ์ต์ข ๋ชจ๋ธ ์์ฑ
*๋ถํธ์คํธ๋ฉ:
ํต๊ณํ์์ ์ฌ์ฉํ๋ ์ฉ์ด๋ก, random sampling์ ์ ์ฉํ๋ ๋ฐฉ๋ฒ
์๋ชป ์์ธกํ ์ํ์ ๋ ์ง์คํ์ฌ ์ ํ๋ ํฅ์ํ ์ ์์
๊ธฐ๋ณธ ๋ชจ๋ธ๋ก๋ ๋ณดํต ์ฝํ ๋ชจ๋ธ ์ฌ์ฉํจ (ex. ๊น์ด๊ฐ ์์ ๊ฒฐ์ ํธ๋ฆฌ)
์ต์ข ์์ธก์, ์ฌ๋ฌ ๋ชจ๋ธ์ ์์ธก์ ๊ฐ์ค ํ๊ท ๋๋ ํฌํ๋ก ํจ
1) AdaBoost (Adaptive Boosting)
2) Gradient Boosting (GBM)
3) XGBoost (Extreme Gradient Boosting)
4) LightGBM
5) CatBoost
| ํญ๋ชฉ | ๋ฐฐ๊น (Bagging) | ๋ถ์คํ (Boosting) |
|---|---|---|
| ํ์ต ๋ฐฉ์ | ๋ณ๋ ฌ | ์์ฐจ |
| ์์ | Random Forest | XGBoost, AdaBoost |
| ๋ชฉ์ | ๋ถ์ฐ ๊ฐ์ | ํธํฅ ๊ฐ์ |
| ์์ธก ๋ฐฉ์ | ๋ค์๊ฒฐ / ํ๊ท | ์ ๊ฐ์ค ํ๊ท ์ฐจ |