๋ฐํ๊น์ง ์ฃผ๋ง ๋ฐ์ ๋จ์ง ์์ ์ํฉ.
ํ์
ppt ์ ์ ํด์ธ ๊ตฌ๊ธ ์ฌ๋ผ์ด๋์์ ์์
ํ๋ค.
๋ฐํ๊น์ง ๋๋ด๊ณ ๊ธ์ ์์ฑํ๋ ์์ ์์ ๋งํ๋ ๊ฑฐ์ง๋ง.. ๊ตฌ๊ธ ์ฌ๋ผ์ด๋๋ณด๋ค ์ ์ EDA ํ๋ก์ ํธ์์ ์ฌ์ฉํ๋ Canva๊ฐ ํจ์ฌ ๋์์ธ๋ ์ฐ์ํ๊ณ ๊ธฐ๋ฅ๋ ๋ง๊ณ ํธํ๋ค.
๋ฌด์๋ณด๋ค ๊ตฌ๊ธ ์ฌ๋ผ์ด๋๋ ํ๊ฒฝ๋ง๋ค ๋ณด์ฌ์ง๋ ํ๋ฉด์ด ๋ค๋ฅด๋ค. ๋ฌด์จ ๋ง์ด๋๋ฉด ์ ์ฌ์ง์์ ๋ณด์ด๋ "Multi-Class Prediction of Obesity Risk" ์์ ๋ชฉ์ ๋ท๋ถ๋ถ Risk๊ฐ ์ค์ ๋ฐํ์์๋(๋ค๋ฅธ ์กฐ์์ ๋
ธํธ๋ถ ํ๋ฉด ๊ณต์ ) ๋ค์ ์ค๋ก ๋ฐ๋ ค์ ์๋ ์ฌ์ง์ฒ๋ผ ๋์๋ค.. (๋นจ๊ฐ ์ค ์ฐธ๊ณ )
(์ค์ ๋ฐํ ํ๋ฉด ์ฐ์ถ)
๋จ์ .. ์ด๋ฐ ๋ํ ์ผ์ด ์์ฑ๋๋ก ์ด์ด์ง๋ค๊ณ ์๊ฐํ๊ณ ์ค์์ํ๋ ์ฌ๋์ธ๋ฐ.. ์ด๊ฑด ๋ง์น ๋ณด๋ ธ๋ณด๋ ธ ppt, ใ TV์ ๋ฟ์๋น ์์ด ์๊ฐ๋๋ ๋ํ ์ผ์ด์๋ค.. (์ถฉ๊ฒฉ)
๊ทธ๋ผ์๋ ์ ๋ถ๋ถ์ ์ฌ์ค ์ฌ์ํ ๊ฑฐ๋ผ์ ๋ฐํ๋ ์ ๋๋ง์ณค๋ค. ๋ฌด์๋ณด๋ค ๋ฐํ์ ๋ ๋ถ๊ป์ ๋ฐํ๋ฅผ ์ํด์ฃผ์
จ๋ค.
๋๋ Upstage AI Lab์์ ๋ชจ๋ ํ๋ก์ ํธ ๋ฐํ์ ์ฐธ๊ฐํ๋ค๊ฐ ์ด๋ฒ์ ๋ถ์ฐธํ๊ฒ ๋์๋๋ฐ, ๋ค๋ฆ์ด ์๋๋ผ 2๊ฐ์ ์ ๋ถํฐ ๊ณํํ ์ผ์ ์ด ๋ฐํ ์ง์ ์ฃผ๋ง๊ณผ ๊ฒน์น๋ ๋ฐ๋์ ์ํด๋ฅผ ๊ตฌํ๊ณ ์๋ฆฌ๋ฅผ ์๋ณดํ๋ค. ๋ฌผ๋ก ํ๋ผ๋ฉด ํ ์ ์์ง๋ง ๋ ๊ฐ์ง ์ด์ ๋๋ฌธ์ ํ์ง ์์๋๋ฐ ์ฒซ์งธ๋ก๋ ๋ฐํ ํ๋ฆฌํฐ ์ ํ, ๊ทธ๋ฆฌ๊ณ ๋ด ๊ฑด๊ฐ์ด ์ฌํ ์ฐ๋ ค๋์๋ค.. (๋งก์ผ๋ฉด ๋ฐค ์๊ฐ๋ฉด์ ํ๋ฆฌํฐ ๋์ด์ฌ๋ฆฌ๋ ์ฌ๋)
๋ด๊ฐ ๋ด๋นํ ๋ถ๋ถ์ LGBM - Hyper Parameter ๋ถ๋ถ.
๋ฐํ์ ๋ ๋ถ๊ป ์๋ฃ ์ดํด๋ฅผ ๋๊ธฐ ์ํด ๋
ธ์
ํ์ด์ง์ ์ ๋ฆฌํ ๊ธ์ด ์๋ค.

(๋ฐํ ์๋ฃ ์ผ๋ถ)
HyperOpt๋ถํฐ Optuna, XGB ๋ชจ๋ธ๋ ๋ฐํ์ ๋ฃ๊ณ ์ถ์๋๋ฐ LGBM๊ณผ ๋น์ทํ ์คํ ๋ฐ ๊ฒฐ๊ณผ์ 3+4 7์ธ ํ์ ๋ฐํ์ด๋ค๋ณด๋ 20๋ถ์ ๋ฐํ ์ ํ์๊ฐ์ ๊ณ ๋ ค, ๊ณผ๊ฐํ ์ ์ธํ๋ค.
๋์ Hyper Parameter ํ๋์ ํตํด ์ป์ ์ฑ๊ณผ(LB 7์)์ params ํ๋์ ํตํ over-fitting control, ๊ทธ๋ฆฌ๊ณ submission ๊ฒฐ๊ณผ๋ฅผ ํตํ LB data์ ๋ํ ๊ฐ์ค๊น์ง ํฌํจ์์ผฐ๋ค(๊ฐ์ค์ ๋ํ ์ข ๋ฃ์, Private Data๊ฐ ๊ณต๊ฐ๋จ์ผ๋ก์จ ๊ทธ ๊ฒฐ๊ณผ๋ฅผ ์ฆ๋ช ํ ์ ์๋ค)
๋ค๋ฅธ ํ๋ค์ ๋ฐํ๋ฅผ ๋ณด๋ฉฐ ๋ค์๋ ์๊ฐ์ "์ฐ๋ฆฌ๊ฐ ์ฐธ ์ฌ์ด ๋ํ์๊ตฌ๋". ๋ด๊ฐ ์ฐธ์ฌํ ๋ํ๋ Playground Series๋ก, ์บ๊ธ ์
๋ฌธ์๋ค์ ์ํด ๋์ด๋๋ฅผ ์๋์ ์ผ๋ก ์ฝ๊ฒ ์กฐ์ ํ ๋ํ์ด๋ค. (์๊ธ๊ณผ ๋ฉ๋ฌ์ด ์๋ค)
๋ค๋ฅธ ๋ถ๋ค์ ์ข
๋ฃ๋์๋ ๋ํ๋, ์๊ธ๊ณผ ๋ฉ๋ฌ์ด ์๋ ๋ํ์ ์ฐธ๊ฐํ์
จ๋๋ฐ LB ์ฑ์ ์ ์ปค๋
๋ฐ์ดํฐ ํด์์ ์๊ฐ์ ๋ชจ์กฐ๋ฆฌ ์๋ชจํ ํ๋ค๋ ์์๋ค.. ๋ฐํ ์์ ์ ์ "~~์ด๋ฌํด์ ๋ฐํ ์๋ฃ๊ฐ ๋ฏธํกํ๋ ์ํด ๋ฐ๋๋ค"๋ผ๊ณ ๋งํ ํ๋ง ์
. ๊ทธ๋งํผ ๋ค๋ค ์ด๋ ค์ ๋ค๋ ์๊ธฐ.

"์ฐ๋งคํจ์ ๋ด์ฐ๋ฆฌ"
LB 7์๋ฅผ ์ฐ๊ณ (๊ทธ๊ฒ๋ ์ฐ์ฐํ) ์์ ๋ง๋งํ๋ ๋ด ๋ชจ์ต, ๊ทธ๋ฆฌ๊ณ ๋ค๋ฅธ ์กฐ์ ๋ฐํ๋ฅผ ๋ณด๊ณ ๋ ๋ค ์ฑ์ฐฐํ ๋ด ๋ชจ์ต์ ์์น๊ฐ ๊ทธ๋ ค์ง๋ ๊ทธ๋ํ์ด๋ค.. ํํ
์๊ฒ ๋ ๊ฒ์ ๋น์ฐ์ ์ผ๊ฐ์ผ๋ก๋ ์ทจ๊ธ๋์ง ์๊ณ , ์ฌ์ ํ ๋ชจ๋ฅด๋ ๊ฒ์ ์ฒ์ง ์๊น๋ฆฌ๋ค. ์ด ๋ถ์ผ์์ ํ์ ๋ฐฐ์์ผ ํ๋ค๋ ๋ง์ ์ง๊ฒน๋๋ก ๋ฃ๋ ์ด์ ์ธ ๊ฒ ๊ฐ๋ค.
๊ทธ๋ผ์๋. ์ด์ฐ๋์๊ฑด, ์ด๋ฒ ํ๋ก์ ํธ๋ '๋ง์กฑ'์ด๋ค. ์บ๊ธ ๋ํ์ ๋ํ ๊ธฐ๋ณธ์ ์ธ ๊ฐ๋
์ ์ดํดํ๊ณ , ์ค์ LB์์ ์ฑ๊ณผ๋ฅผ ๋ด๊ธฐ์ํด ๋ฉฐ์น ๊ฐ ๋ฐค์๋๋ก ๋ฌ๋ ค๋ณด์๊ณ , ํ ํ์
์ ๋ํ ๊ฒฝํ๋ ์๊ฒ ๋์๋ค.
์ด๋์ ํ๋ก์ ํธ๋ฅผ ๋ด๊ฐ ์ข์ํ์ง.
์ค๋๋ก ML ํ๋ก์ ํธ๋ ๋ง๋ฌด๋ฆฌ ๋์๋ค.
๋ด์ผ์ Upstage OT๋ฅผ ์์์ผ๋ก Upstage ํ์ง์๋ถ๋ค์ ๊ฐ์๊ฐ ๋ณธ๊ฒฉ์ ์ผ๋ก ์์๋๋ค. Deep Learning์ด ๋ค์ ์คํ
์ธ๋ฐ, ์๋ง ์ ์ ์ด๋ ค์์ง ๊ฒ์ผ๋ก ์์.
๊ทธ์น๋ง ๋ฐฐ์ธ ๊ฒ์ด ์์ง ํ์ฐธ ๋จ์๋ค๋ ๊ฒ ์คํ๋ ค ์ฆ๊ฒ๊ณ ์ค๋ ๋ค. ๋ด๊ฐ ๋ฐฐ์ด ๊ฒ์ ๊ณ ์ ML์ ํ์
๊ฑฐ๋ฆฌ ์๋์๋.
๋๋ ๋จธ์ ๋ฌ๋๋ณด๋ค ๋ฅ๋ฌ๋์ ๋ ๊ด์ฌ์ด ์๋ ๋งํผ, ๋ฅ๋ฌ๋ ํ๋ก์ ํธ์์๋ ๋ ์ฌ๋ฐ๊ณ ์ด๋ ต๊ณ ๊ฒฉํ ๊ฒฝํ์ ๊ฐ๊ฒ ๋๋ฆฌ๋ผ ๊ธฐ๋ํ๊ณ ์๋ค.
์์ผ๋ก๋ ์ ์ง.