๐Ÿ“Š ๋ฐœํ‘œ ์ž๋ฃŒ

๋ฐœํ‘œ๊นŒ์ง€ ์ฃผ๋ง ๋ฐ–์— ๋‚จ์ง€ ์•Š์€ ์ƒํ™ฉ.
ํ˜‘์—… ppt ์ œ์ž‘ ํˆด์ธ ๊ตฌ๊ธ€ ์Šฌ๋ผ์ด๋“œ์—์„œ ์ž‘์—…ํ–ˆ๋‹ค.

๋ฐœํ‘œ๊นŒ์ง€ ๋๋‚ด๊ณ  ๊ธ€์„ ์ž‘์„ฑํ•˜๋Š” ์‹œ์ ์—์„œ ๋งํ•˜๋Š” ๊ฑฐ์ง€๋งŒ.. ๊ตฌ๊ธ€ ์Šฌ๋ผ์ด๋“œ๋ณด๋‹ค ์ „์— EDA ํ”„๋กœ์ ํŠธ์—์„œ ์‚ฌ์šฉํ–ˆ๋˜ Canva๊ฐ€ ํ›จ์”ฌ ๋””์ž์ธ๋„ ์šฐ์ˆ˜ํ•˜๊ณ  ๊ธฐ๋Šฅ๋„ ๋งŽ๊ณ  ํŽธํ–ˆ๋‹ค.
๋ฌด์—‡๋ณด๋‹ค ๊ตฌ๊ธ€ ์Šฌ๋ผ์ด๋“œ๋Š” ํ™˜๊ฒฝ๋งˆ๋‹ค ๋ณด์—ฌ์ง€๋Š” ํ™”๋ฉด์ด ๋‹ค๋ฅด๋‹ค. ๋ฌด์Šจ ๋ง์ด๋ƒ๋ฉด ์œ„ ์‚ฌ์ง„์—์„œ ๋ณด์ด๋Š” "Multi-Class Prediction of Obesity Risk" ์†Œ์ œ๋ชฉ์˜ ๋’ท๋ถ€๋ถ„ Risk๊ฐ€ ์‹ค์ œ ๋ฐœํ‘œ์—์„œ๋Š”(๋‹ค๋ฅธ ์กฐ์›์˜ ๋…ธํŠธ๋ถ ํ™”๋ฉด ๊ณต์œ ) ๋‹ค์Œ ์ค„๋กœ ๋ฐ€๋ ค์„œ ์•„๋ž˜ ์‚ฌ์ง„์ฒ˜๋Ÿผ ๋‚˜์™”๋‹ค.. (๋นจ๊ฐ„ ์ค„ ์ฐธ๊ณ )

(์‹ค์ œ ๋ฐœํ‘œ ํ™”๋ฉด ์—ฐ์ถœ)

๋œจ์•….. ์ด๋Ÿฐ ๋””ํ…Œ์ผ์ด ์™„์„ฑ๋„๋กœ ์ด์–ด์ง„๋‹ค๊ณ  ์ƒ๊ฐํ•˜๊ณ  ์ค‘์š”์‹œํ•˜๋Š” ์‚ฌ๋žŒ์ธ๋ฐ.. ์ด๊ฑด ๋งˆ์น˜ ๋ณด๋…ธ๋ณด๋…ธ ppt, ใ…„TV์˜ ๋ฟŒ์Š๋น ์Š์ด ์ƒ๊ฐ๋‚˜๋Š” ๋””ํ…Œ์ผ์ด์—ˆ๋‹ค.. (์ถฉ๊ฒฉ)

๊ทธ๋Ÿผ์—๋„ ์œ„ ๋ถ€๋ถ„์€ ์‚ฌ์‹ค ์‚ฌ์†Œํ•œ ๊ฑฐ๋ผ์„œ ๋ฐœํ‘œ๋Š” ์ž˜ ๋๋งˆ์ณค๋‹ค. ๋ฌด์—‡๋ณด๋‹ค ๋ฐœํ‘œ์ž ๋‘ ๋ถ„๊ป˜์„œ ๋ฐœํ‘œ๋ฅผ ์ž˜ํ•ด์ฃผ์…จ๋‹ค.
๋‚˜๋Š” Upstage AI Lab์—์„œ ๋ชจ๋“  ํ”„๋กœ์ ํŠธ ๋ฐœํ‘œ์— ์ฐธ๊ฐ€ํ–ˆ๋‹ค๊ฐ€ ์ด๋ฒˆ์—” ๋ถˆ์ฐธํ•˜๊ฒŒ ๋˜์—ˆ๋Š”๋ฐ, ๋‹ค๋ฆ„์ด ์•„๋‹ˆ๋ผ 2๊ฐœ์›” ์ „๋ถ€ํ„ฐ ๊ณ„ํšํ•œ ์ผ์ •์ด ๋ฐœํ‘œ ์ง์ „ ์ฃผ๋ง๊ณผ ๊ฒน์น˜๋Š” ๋ฐ”๋žŒ์— ์–‘ํ•ด๋ฅผ ๊ตฌํ•˜๊ณ  ์ž๋ฆฌ๋ฅผ ์–‘๋ณดํ–ˆ๋‹ค. ๋ฌผ๋ก  ํ•˜๋ผ๋ฉด ํ•  ์ˆœ ์žˆ์ง€๋งŒ ๋‘ ๊ฐ€์ง€ ์ด์œ  ๋•Œ๋ฌธ์— ํ•˜์ง€ ์•Š์•˜๋Š”๋ฐ ์ฒซ์งธ๋กœ๋Š” ๋ฐœํ‘œ ํ€„๋ฆฌํ‹ฐ ์ €ํ•˜, ๊ทธ๋ฆฌ๊ณ  ๋‚ด ๊ฑด๊ฐ•์ด ์‹ฌํžˆ ์šฐ๋ ค๋˜์—ˆ๋‹ค.. (๋งก์œผ๋ฉด ๋ฐค ์ƒˆ๊ฐ€๋ฉด์„œ ํ€„๋ฆฌํ‹ฐ ๋Œ์–ด์˜ฌ๋ฆฌ๋Š” ์‚ฌ๋žŒ)

๋ฐœํ‘œ ์ž๋ฃŒ ๋ง›๋ณด๊ธฐ

๋‚ด๊ฐ€ ๋‹ด๋‹นํ•œ ๋ถ€๋ถ„์€ LGBM - Hyper Parameter ๋ถ€๋ถ„.
๋ฐœํ‘œ์ž ๋‘ ๋ถ„๊ป˜ ์ž๋ฃŒ ์ดํ•ด๋ฅผ ๋•๊ธฐ ์œ„ํ•ด ๋…ธ์…˜ ํŽ˜์ด์ง€์— ์ •๋ฆฌํ•œ ๊ธ€์ด ์žˆ๋‹ค.

(๋ฐœํ‘œ ์ž๋ฃŒ ์ผ๋ถ€)

HyperOpt๋ถ€ํ„ฐ Optuna, XGB ๋ชจ๋ธ๋„ ๋ฐœํ‘œ์— ๋„ฃ๊ณ  ์‹ถ์—ˆ๋Š”๋ฐ LGBM๊ณผ ๋น„์Šทํ•œ ์‹คํ—˜ ๋ฐ ๊ฒฐ๊ณผ์— 3+4 7์ธ ํŒ€์˜ ๋ฐœํ‘œ์ด๋‹ค๋ณด๋‹ˆ 20๋ถ„์˜ ๋ฐœํ‘œ ์ œํ•œ์‹œ๊ฐ„์„ ๊ณ ๋ ค, ๊ณผ๊ฐํžˆ ์ œ์™ธํ–ˆ๋‹ค.

๋Œ€์‹  Hyper Parameter ํŠœ๋‹์„ ํ†ตํ•ด ์–ป์€ ์„ฑ๊ณผ(LB 7์œ„)์™€ params ํŠœ๋‹์„ ํ†ตํ•œ over-fitting control, ๊ทธ๋ฆฌ๊ณ  submission ๊ฒฐ๊ณผ๋ฅผ ํ†ตํ•œ LB data์— ๋Œ€ํ•œ ๊ฐ€์„ค๊นŒ์ง€ ํฌํ•จ์‹œ์ผฐ๋‹ค(๊ฐ€์„ค์€ ๋Œ€ํšŒ ์ข…๋ฃŒ์‹œ, Private Data๊ฐ€ ๊ณต๊ฐœ๋จ์œผ๋กœ์จ ๊ทธ ๊ฒฐ๊ณผ๋ฅผ ์ฆ๋ช…ํ•  ์ˆ˜ ์žˆ๋‹ค)

๐ŸŒŸ ๋ฐœํ‘œ ๋‹น์ผ

๋‹ค๋ฅธ ํŒ€๋“ค์˜ ๋ฐœํ‘œ๋ฅผ ๋ณด๋ฉฐ ๋“ค์—ˆ๋˜ ์ƒ๊ฐ์€ "์šฐ๋ฆฌ๊ฐ€ ์ฐธ ์‰ฌ์šด ๋Œ€ํšŒ์˜€๊ตฌ๋‚˜". ๋‚ด๊ฐ€ ์ฐธ์—ฌํ•œ ๋Œ€ํšŒ๋Š” Playground Series๋กœ, ์บ๊ธ€ ์ž…๋ฌธ์ž๋“ค์„ ์œ„ํ•ด ๋‚œ์ด๋„๋ฅผ ์˜๋„์ ์œผ๋กœ ์‰ฝ๊ฒŒ ์กฐ์ •ํ•œ ๋Œ€ํšŒ์ด๋‹ค. (์ƒ๊ธˆ๊ณผ ๋ฉ”๋‹ฌ์ด ์—†๋‹ค)
๋‹ค๋ฅธ ๋ถ„๋“ค์€ ์ข…๋ฃŒ๋˜์—ˆ๋˜ ๋Œ€ํšŒ๋‚˜, ์ƒ๊ธˆ๊ณผ ๋ฉ”๋‹ฌ์ด ์žˆ๋Š” ๋Œ€ํšŒ์— ์ฐธ๊ฐ€ํ•˜์…จ๋Š”๋ฐ LB ์„ฑ์ ์€ ์ปค๋…• ๋ฐ์ดํ„ฐ ํ•ด์„์— ์‹œ๊ฐ„์„ ๋ชจ์กฐ๋ฆฌ ์†Œ๋ชจํ•œ ํŒ€๋“ค๋„ ์žˆ์—ˆ๋‹ค.. ๋ฐœํ‘œ ์‹œ์ž‘ ์ „์— "~~์ด๋Ÿฌํ•ด์„œ ๋ฐœํ‘œ ์ž๋ฃŒ๊ฐ€ ๋ฏธํกํ•˜๋‹ˆ ์–‘ํ•ด ๋ฐ”๋ž€๋‹ค"๋ผ๊ณ  ๋งํ•œ ํŒ€๋งŒ ์…‹. ๊ทธ๋งŒํผ ๋‹ค๋“ค ์–ด๋ ค์› ๋‹ค๋Š” ์–˜๊ธฐ.

"์šฐ๋งคํ•จ์˜ ๋ด‰์šฐ๋ฆฌ"

LB 7์œ„๋ฅผ ์ฐ๊ณ (๊ทธ๊ฒƒ๋„ ์šฐ์—ฐํžˆ) ์ž์‹ ๋งŒ๋งŒํ•˜๋˜ ๋‚ด ๋ชจ์Šต, ๊ทธ๋ฆฌ๊ณ  ๋‹ค๋ฅธ ์กฐ์˜ ๋ฐœํ‘œ๋ฅผ ๋ณด๊ณ  ๋‚œ ๋’ค ์„ฑ์ฐฐํ•œ ๋‚ด ๋ชจ์Šต์˜ ์œ„์น˜๊ฐ€ ๊ทธ๋ ค์ง€๋Š” ๊ทธ๋ž˜ํ”„์ด๋‹ค.. ํ•˜ํ•˜
์•Œ๊ฒŒ ๋œ ๊ฒƒ์€ ๋น™์‚ฐ์˜ ์ผ๊ฐ์œผ๋กœ๋„ ์ทจ๊ธ‰๋˜์ง€ ์•Š๊ณ , ์—ฌ์ „ํžˆ ๋ชจ๋ฅด๋Š” ๊ฒƒ์€ ์ฒœ์ง€ ์‚๊นŒ๋ฆฌ๋‹ค. ์ด ๋ถ„์•ผ์—์„  ํ‰์ƒ ๋ฐฐ์›Œ์•ผ ํ•œ๋‹ค๋Š” ๋ง์„ ์ง€๊ฒน๋„๋ก ๋“ฃ๋Š” ์ด์œ ์ธ ๊ฒƒ ๊ฐ™๋‹ค.

๊ทธ๋Ÿผ์—๋„. ์–ด์ฐŒ๋˜์—ˆ๊ฑด, ์ด๋ฒˆ ํ”„๋กœ์ ํŠธ๋Š” '๋งŒ์กฑ'์ด๋‹ค. ์บ๊ธ€ ๋Œ€ํšŒ์— ๋Œ€ํ•œ ๊ธฐ๋ณธ์ ์ธ ๊ฐœ๋…์„ ์ดํ•ดํ–ˆ๊ณ , ์‹ค์ œ LB์—์„œ ์„ฑ๊ณผ๋ฅผ ๋‚ด๊ธฐ์œ„ํ•ด ๋ฉฐ์น ๊ฐ„ ๋ฐค์ƒˆ๋„๋ก ๋‹ฌ๋ ค๋ณด์•˜๊ณ , ํŒ€ ํ˜‘์—…์— ๋Œ€ํ•œ ๊ฒฝํ—˜๋„ ์Œ“๊ฒŒ ๋˜์—ˆ๋‹ค.
์ด๋ž˜์„œ ํ”„๋กœ์ ํŠธ๋ฅผ ๋‚ด๊ฐ€ ์ข‹์•„ํ•˜์ง€.

๋งˆ๋ฌด๋ฆฌ

์˜ค๋Š˜๋กœ ML ํ”„๋กœ์ ํŠธ๋„ ๋งˆ๋ฌด๋ฆฌ ๋˜์—ˆ๋‹ค.
๋‚ด์ผ์€ Upstage OT๋ฅผ ์‹œ์ž‘์œผ๋กœ Upstage ํ˜„์ง์ž๋ถ„๋“ค์˜ ๊ฐ•์˜๊ฐ€ ๋ณธ๊ฒฉ์ ์œผ๋กœ ์‹œ์ž‘๋œ๋‹ค. Deep Learning์ด ๋‹ค์Œ ์Šคํ…์ธ๋ฐ, ์•„๋งˆ ์ ์  ์–ด๋ ค์›Œ์งˆ ๊ฒƒ์œผ๋กœ ์˜ˆ์ƒ.
๊ทธ์น˜๋งŒ ๋ฐฐ์šธ ๊ฒƒ์ด ์•„์ง ํ•œ์ฐธ ๋‚จ์•˜๋‹ค๋Š” ๊ฒŒ ์˜คํžˆ๋ ค ์ฆ๊ฒ๊ณ  ์„ค๋ Œ๋‹ค. ๋‚ด๊ฐ€ ๋ฐฐ์šด ๊ฒƒ์€ ๊ณ ์ž‘ ML์˜ ํ•œ์ž…๊ฑฐ๋ฆฌ ์•„๋‹ˆ์—ˆ๋‚˜.
๋‚˜๋Š” ๋จธ์‹ ๋Ÿฌ๋‹๋ณด๋‹ค ๋”ฅ๋Ÿฌ๋‹์— ๋” ๊ด€์‹ฌ์ด ์žˆ๋Š” ๋งŒํผ, ๋”ฅ๋Ÿฌ๋‹ ํ”„๋กœ์ ํŠธ์—์„œ๋Š” ๋” ์žฌ๋ฐŒ๊ณ  ์–ด๋ ต๊ณ  ๊ฒฉํ•œ ๊ฒฝํ—˜์„ ๊ฐ–๊ฒŒ ๋˜๋ฆฌ๋ผ ๊ธฐ๋Œ€ํ•˜๊ณ  ์žˆ๋‹ค.

์•ž์œผ๋กœ๋„ ์ •์ง„.

0๊ฐœ์˜ ๋Œ“๊ธ€