๐ŸŒท์•™์ƒ๋ธ” ๋ถ€์ŠคํŒ… Ensemble Boosting

์žฅ์ฑ„๋ฏผยท2025๋…„ 7์›” 29์ผ

1. ๐Ÿ’ก์•™์ƒ๋ธ” ํ•™์Šต์ด๋ž€?

์—ฌ๋Ÿฌ ๊ฐœ์˜ ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ(์•ฝํ•œ ํ•™์Šต๊ธฐ)์„ ๊ฒฐํ•ฉํ•ด ๋” ์ข‹์€ ์„ฑ๋Šฅ์„ ์–ป๋Š” ๊ธฐ๋ฒ•

โœ๏ธ ์•™์ƒ๋ธ” ๊ธฐ๋ฒ•:

  • Bagging: ๋ณ‘๋ ฌ์ ์œผ๋กœ ํ•™์Šต(์˜ˆ: ๋žœ๋คํฌ๋ ˆ์ŠคํŠธ) / *๋ถ€ํŠธ์ŠคํŠธ๋žฉ ์ง‘๊ณ„ํ•˜์—ฌ ํ•™์Šต๋ฐ์ดํ„ฐ๊ฐ€ ์ถฉ๋ถ„ํ•˜์ง€ ์•Š๋”๋ผ๋„ ํ•™์Šตํšจ๊ณผ๊ฐ€ ๋†’์Œ

  • Boosting: ์ˆœ์ฐจ์ ์œผ๋กœ ํ•™์Šต (์ด์ „ ๋ถ„๋ฅ˜๊ธฐ์˜ ํ•™์Šต ๊ฒฐ๊ณผ๋ฅผ ํ† ๋Œ€๋กœ, ๋‹ค์Œ ๋ถ„๋ฅ˜๊ธฐ์˜ ํ•™์Šต ๋ฐ์ดํ„ฐ ์ƒ˜ํ”Œ ๊ฐ€์ค‘์น˜๋ฅผ ์กฐ์ •ํ•ด ํ•™์Šต์„ ์ง„ํ–‰ํ•จ) / ์˜ค๋‹ต์— ๋Œ€ํ•ด ๋†’์€ ๊ฐ€์ค‘์น˜๋ฅผ ๋ถ€์—ฌํ•˜๋ฏ€๋กœ ์ •ํ™•๋„๊ฐ€ ๋†’์Œ. ๊ทธ๋Ÿฌ๋‚˜ ์ด์ƒ์น˜์— ์•ฝํ•จ (์˜ˆ: XGBoost, AdaBoost, GradientBoost)

  • Stacking: ํฌ๋กœ์Šค ๋ฒจ๋ฆฌ๋ฐ์ด์…˜(Cross Validation)์œผ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ์ชผ๊ฐฌ. Base Learner๋“ค์€ 10-fold CV๋ฅผ ํ•ด ์›๋ณธ ๋ฐ์ดํ„ฐ๋ฅผ ๊ฐ fold๋ณ„๋กœ ์ชผ๊ฐœ์–ด ํ•™์Šตํ•จ. ์ด ๊ฒฐ๊ณผ๊ฐ’๊ณผ ์˜ˆ์ธก๊ฐ’์˜ ํ‰๊ท ์„ meta ๋ชจ๋ธ์— ์‚ฌ์šฉ -> ์ตœ์ข… ๋ชจ๋ธ ์ƒ์„ฑ


*๋ถ€ํŠธ์ŠคํŠธ๋žฉ:
ํ†ต๊ณ„ํ•™์—์„œ ์‚ฌ์šฉํ•˜๋Š” ์šฉ์–ด๋กœ, random sampling์„ ์ ์šฉํ•˜๋Š” ๋ฐฉ๋ฒ•


2. ๐Ÿš€ ๋ถ€์ŠคํŒ…์˜ ํ•ต์‹ฌ ๊ฐœ๋…

  • ์ž˜๋ชป ์˜ˆ์ธกํ•œ ์ƒ˜ํ”Œ์— ๋” ์ง‘์ค‘ํ•˜์—ฌ ์ •ํ™•๋„ ํ–ฅ์ƒํ•  ์ˆ˜ ์žˆ์Œ

  • ๊ธฐ๋ณธ ๋ชจ๋ธ๋กœ๋Š” ๋ณดํ†ต ์•ฝํ•œ ๋ชจ๋ธ ์‚ฌ์šฉํ•จ (ex. ๊นŠ์ด๊ฐ€ ์–•์€ ๊ฒฐ์ • ํŠธ๋ฆฌ)

  • ์ตœ์ข… ์˜ˆ์ธก์€, ์—ฌ๋Ÿฌ ๋ชจ๋ธ์˜ ์˜ˆ์ธก์„ ๊ฐ€์ค‘ ํ‰๊ท  ๋˜๋Š” ํˆฌํ‘œ๋กœ ํ•จ



3. ๐Ÿ“š ๋Œ€ํ‘œ์ ์ธ ๋ถ€์ŠคํŒ… ์•Œ๊ณ ๋ฆฌ์ฆ˜

1) AdaBoost (Adaptive Boosting)

  • ์ตœ์ดˆ์˜ ๋ถ€์ŠคํŒ… ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์ค‘ ํ•˜๋‚˜
  • ํ‹€๋ฆฐ ์ƒ˜ํ”Œ์— ๋” ํฐ ๊ฐ€์ค‘์น˜๋ฅผ ๋ถ€์—ฌ
  • ์˜ˆ์ธก ๊ฒฐ๊ณผ๋Š” ๊ฐ ๋ชจ๋ธ์˜ ๊ฐ€์ค‘ ํ•ฉ
  • ํŠน์ง•: ๋…ธ์ด์ฆˆ์— ์•ฝํ•  ์ˆ˜ ์žˆ์Œ.

2) Gradient Boosting (GBM)

  • ์˜ค์ฐจ(loss function)์˜ ๊ธฐ์šธ๊ธฐ(gradient) ๋ฐฉํ–ฅ์œผ๋กœ ๋ชจ๋ธ์„ ๊ฐœ์„ 
  • ๊ฐ ๋‹จ๊ณ„์—์„œ ์ž”์ฐจ(residual)๋ฅผ ์ค„์ด๋„๋ก ํ•™์Šต
  • ์†์‹ค ํ•จ์ˆ˜ ์ง€์ • ๊ฐ€๋Šฅ -> ํšŒ๊ท€, ๋ถ„๋ฅ˜ ๋ชจ๋‘ ์ ์šฉ ๊ฐ€๋Šฅ

3) XGBoost (Extreme Gradient Boosting)

  • GBM์˜ ํ™•์žฅ ๋ฒ„์ „ (์†๋„์™€ ์„ฑ๋Šฅ ๊ฐœ์„ )
  • ์ •๊ทœํ™”, ๊ฒฐ์ธก์น˜ ์ฒ˜๋ฆฌ, ๋ณ‘๋ ฌ ํ•™์Šต, ์กฐ๊ธฐ ์ข…๋ฃŒ ์ง€์›
  • Kaggle์—์„œ ๋„๋ฆฌ ์‚ฌ์šฉ๋˜๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜

4) LightGBM

  • ๋ฆฌํ”„ ์ค‘์‹ฌ ์„ฑ์žฅ(Leaf-wise) ๋ฐฉ์‹ -> ์†๋„ ๋น ๋ฆ„
  • ๋Œ€์šฉ๋Ÿ‰ ๋ฐ์ดํ„ฐ์—์„œ ๋งค์šฐ ํšจ๊ณผ์ 
  • ๋‹จ์ : ๊ณผ์ ํ•ฉ ์ฃผ์˜

5) CatBoost

  • ๋ฒ”์ฃผํ˜• ๋ณ€์ˆ˜ ์ž๋™ ์ฒ˜๋ฆฌ์— ๊ฐ•ํ•จ
  • ์ ์€ ๋ฐ์ดํ„ฐ์—๋„ ์•ˆ์ •์  ์„ฑ๋Šฅ



4. โœจ๋ถ€์ŠคํŒ…๊ณผ ๋ฐฐ๊น…์˜ ์ฐจ์ด

ํ•ญ๋ชฉ๋ฐฐ๊น…(Bagging)๋ถ€์ŠคํŒ…(Boosting)
ํ•™์Šต ๋ฐฉ์‹๋ณ‘๋ ฌ์ˆœ์ฐจ
์˜ˆ์‹œRandom ForestXGBoost, AdaBoost
๋ชฉ์ ๋ถ„์‚ฐ ๊ฐ์†ŒํŽธํ–ฅ ๊ฐ์†Œ
์˜ˆ์ธก ๋ฐฉ์‹๋‹ค์ˆ˜๊ฒฐ / ํ‰๊ท ์ˆœ ๊ฐ€์ค‘ ํ‰๊ท ์ฐจ

0๊ฐœ์˜ ๋Œ“๊ธ€