๐Ÿ‘ฉโ€๐Ÿซ DACON | ๋ฐ์ด์ฝ˜์œผ๋กœ ๋ฐ์ดํ„ฐ ๋ถ„์„ ๊ณผ์ œ ๊ณต๋ถ€ํ•˜๊ธฐ

zerocokeยท2024๋…„ 4์›” 22์ผ
2

Review

๋ชฉ๋ก ๋ณด๊ธฐ
2/2

๋ฐ์ด์ฝ˜์˜ ํฌ๋งท์ด ๋งŽ์ด ๋ณ€ํ–ˆ๋‹ค. ๊ทธ ์ „์—๋Š” ๊ฒฝ์ง„๋Œ€ํšŒ์˜ ์„ฑ๊ฒฉ๋งŒ ๋ ๊ณ  ์žˆ์—ˆ๋‹ค๋ฉด, ์ง€๊ธˆ์€ ๋ฐ์ดํ„ฐ ๋ถ„์„์„ ์œ„ํ•œ ํ•™์Šต ์ฑ„๋„๋กœ๋„ ๊ทธ ์—ญํ• ์„ ํ™•์žฅํ•˜๊ณ  ์žˆ๋Š” ๋“ฏ ํ•˜๋‹ค. ๊ทธ๋ฆฌํ•˜์—ฌ!!! ๋ฐ์ด์ฝ˜์œผ๋กœ ๋ฐ์ดํ„ฐ ๋ถ„์„ ๊ณผ์ œ๋ฅผ ์–ด๋–ป๊ฒŒ ์ค€๋น„ํ•˜๊ณ  ๊ณต๋ถ€ํ•  ์ˆ˜ ์žˆ์„์ง€ ์„ค๋ช…ํ•ด ๋ณด๊ฒ ๋‹ค. ๋ฐ์ดํ„ฐ ๋ถ„์„ ๊ณผ์ œ ๋‚œ์ด๋„๋Š” ๋‚ด๊ฐ€ ๋ดค๋˜ 2023 ํ•˜๋ฐ˜๊ธฐ SK C&C, 2023 ํ•˜๋ฐ˜๊ธฐ ํ˜„๋Œ€์บํ”ผํƒˆ์„ ๊ธฐ์ค€์œผ๋กœ ํ•˜๊ณ  ์žˆ๋‹ค. (์—ฌ๊ธฐ์„œ ๋” ์–ด๋ ค์›Œ ์งˆ ์ˆ˜๋„ ์žˆ๊ณ  ํฌ๋งท์ด ๋ฐ”๋€” ์ˆ˜๋„ ์žˆ๊ธฐ์— ๋ฐํž˜)

๐Ÿ—„๏ธ ํ”„๋กœ์ ํŠธ ์„ ํƒ

DACON์— ๋“ค์–ด๊ฐ€์„œ ์ฃผ...์šฑ ์Šคํฌ๋กค์„ ๋‚ด๋ฆฌ๋‹ค ๋ณด๋ฉด ์•„๋ž˜์ฒ˜๋Ÿผ "ํ”„๋กœ์ ํŠธ"๋ฅผ ์ฐพ์„ ์ˆ˜ ์žˆ๋‹ค.

  • ๋ถ„๋ฅ˜? ํšŒ๊ท€? ... ๊ฐ€์žฅ ๊ธฐ๋ณธ์ ์œผ๋กœ๋Š” ์ด ๋‘ ๊ฐ€์ง€๊ฐ€ ์žˆ๋Š”๋ฐ, ๋‘˜ ์ค‘ ์–ด๋–ค ๊ฑธ ๊ณต๋ถ€ํ• ์ง€ ์ •ํ•˜๋Š” ๊ฒŒ ์ข‹๋‹ค. ์•ˆ๊ทธ๋Ÿผ ์ฃฝ๋„๋ก ํ•˜๋‚˜๋งŒ ํŒ” ์ˆ˜๋„ ์žˆ์œผ๋‹ˆ๊นŒ...
  • ํ”„๋กœ์ ํŠธ์—์„œ ์ฐจ๊ทผ์ฐจ๊ทผ ๊ฐˆ ์ˆ˜๋„ ์žˆ์ง€๋งŒ, ์œ ๋ช…ํ•œ ํ”„๋กœ์ ํŠธ๋ฅผ ์„ ํƒํ•ด๋„ ์ข‹๋‹ค.
  • ๋ถ„๋ฅ˜ โ†’ ๋‹น๋‡จ๋ณ‘ ๋ถ„๋ฅ˜, ํƒ€์ดํƒ€๋‹‰
  • ํšŒ๊ท€ โ†’ ๋ณด์Šคํ„ด ์ง‘๊ฐ’

๐Ÿ“š ํ•™์Šตํ•˜๊ธฐ

์ด ํ”„๋กœ์ ํŠธ๋กœ ๋“ค์–ด๊ฐ€๋ฉด ์ž…๋ฌธ, ์ดˆ๊ธ‰, ์ค‘๊ธ‰ ํ”„๋กœ์ ํŠธ ์ค‘ ์„ ํƒํ•ด์„œ ํ•™์Šตํ•  ์ˆ˜ ์žˆ๋Š”๋ฐ,

Python์„ ์ฒ˜์Œ ์ ‘ํ•˜๋Š” ์™„์ „ ์ž…๋ฌธ์ž ์ˆ˜์ค€์ด ์•„๋‹ˆ๋ผ๋ฉด ๊ตณ์ด ์ด "ํ•™์Šตํ•˜๊ธฐ"๋ฅผ ๊ถŒํ•˜์ง€ ์•Š๋Š”๋‹ค." - ์‚ฌ์œ : ํ•™์Šตํ•˜๊ธฐ ์จ๋ดค๋Š”๋ฐ ๊ทธ์ € ๊ท€์ฐฎ -
(๊ทธ๋Ÿผ ์–ด๋–กํ•˜๋ผ๊ณ .์–ด๋œจ์นด๋ผ๊ณ .์–ด๋–ปํ•˜๋ผ๊ณ .์–ด๋–ก์ฝฐ๋ผ๊ณ .)

์Šคํฌ๋กค์„ ๋‚ด๋ ค๋ณด๋ฉด ์•„๋ž˜์™€ ๊ฐ™์ด "*** ๋Œ€ํšŒ ์ฐธ๊ฐ€ํ•˜๊ธฐ"๋ฅผ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋‹ค.

ํด๋ฆญํ•˜๋ฉด ๋Œ€ํšŒ์— ์ฐธ์—ฌํ•ด ๊ฒฐ๊ณผ๋ฌผ์„ ์ œ์ถœํ•˜๊ณ  ๋‹ค๋ฅธ ์ฐธ๊ฐ€์ž์™€ ๊ฒจ๋ฃฐ ์ˆ˜ ์žˆ๋‹ค.
ํ•˜์ง€๋งŒ ์ค‘์š”ํ•œ ๊ฑด ๋ฐ”๋กœ "์ฝ”๋“œ ๊ณต์œ " ํƒญ.

๋“ค์–ด๊ฐ€ ๋ณด๋ฉด ๊ณต์ง€๋กœ Baseline ์ฝ”๋“œ๋ฅผ ์ œ๊ณตํ•ด ์ค€๋‹ค. (์ตœ๊ทผ ๊ฐœ์ตœ๋˜๋Š” ๊ฒฝ์ง„๋Œ€ํšŒ/ํ•ด์ปคํ†ค์—” ์—†๋Š” ๋“ฏ)
๋‚ด๊ฐ€ ์ด์ „์— ์ž‘์„ฑํ•œ ๊ณผ์ œํ…Œ์ŠคํŠธ ํ›„๊ธฐ์˜ ๊ฟ€ํŒ์—์„œ ๋งํ•œ "๋ฐ์ด์ฝ˜ Baseline ์ฝ”๋“œ"๊ฐ€ ๋ฐ”๋กœ ์ด๊ฒƒ!!!

์ด ์ฝ”๋“œ๋ฅผ Jupyter notebook์ด๋‚˜ google colab์—์„œ ํ•˜๋‚˜ํ•˜๋‚˜ ๋”ฐ๋ผํ•ด ๋ณด๋ฉด ์ข‹์„ ๋“ฏ ํ•˜๋‹ค.

์ด Baseline์œผ๋กœ ๊ณต๋ถ€๋ฅผ ์ถ”์ฒœํ•˜๋Š” ์ด์œ ?

  • ๋ฐ์ด์ฝ˜ ๋ฐ”์ด๋Ÿด ์•„๋‹™๋‹ˆ๋‹ค.
  • ์ด ์ฝ”๋“œ๋ฅผ ๋ณด๋ฉด ์•„์ฃผ์•„์ฃผ ๋‹จ์ˆœํ•˜๊ณ  ๊น”๋”ํ•˜๊ฒŒ ์ •๋ฆฌ๊ฐ€ ๋˜์–ด ์žˆ๋‹ค. ๋”ฐ๋ผ์„œ ์ดˆ๋ณด์ž๋ผ๋„ ์ถฉ๋ถ„ํžˆ ๋”ฐ๋ผํ•  ์ˆ˜ ์žˆ๋‹ค.
  • ๋Œ€์ฒด๋กœ scikit-learn ๋ชจ๋ธ๋“ค์„ ์‚ฌ์šฉํ•˜๊ธฐ ๋•Œ๋ฌธ์— ๊ณผ์ œํ…Œ์ŠคํŠธ ์ค€๋น„ํ•˜๊ธฐ ์ ๋‹นํ•˜๋‹ค. (๋‚ด๊ฐ€ ๋ดค๋˜ ๊ณผ์ œํ…Œ์ŠคํŠธ๋“ค์€ ์‚ฌ์ „ ์„ค์น˜๋œ scikit-learn๋งŒ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์—ˆ์Œ)

๐Ÿ’ก ++

  • ์‹œ๊ฐ„์€ ์—†๋Š”๋ฐ ์–ด๋–ค ์ „์ฒ˜๋ฆฌ ๋ฐฉ๋ฒ• / ๋ชจ๋ธ์„ ๋ญ˜ ์„ ํƒํ•ด์•ผํ•  ์ง€ ๋ชจ๋ฅด๊ฒ ๋‹ค!!!! ใ…œใ…œ

    • ๋ฐ์ดํ„ฐ ์ „์ฒ˜๋ฆฌ

      • numerical data: StandardScaler, MinMaxScaler
      • categorical data: OneHotEncoder, LabelEncoder
    • ๋ชจ๋ธ

      • ๋ถ„๋ฅ˜: RandomForestClassifier, DecisionTreeClassifier
      • ํšŒ๊ท€: LogisticRegression, RandomForestRegressor
    • ๊ฐ ํ•ญ๋ชฉ๋“ค ์ค‘ ํ•œ ๊ฐ€์ง€ ์”ฉ๋งŒ ์ฐ์–ด์„œ ํ™œ์šฉ ๋ฐฉ๋ฒ•๋งŒ ์—ฐ์Šตํ•œ๋‹ค๋ฉด ์ค€๋น„ ์‹œ๊ฐ„์ด ์ด‰๋ฐ•ํ•ด๋„ ์ถฉ๋ถ„ํžˆ ๋Œ€๋น„ ๊ฐ€๋Šฅํ•˜๋‹ค๊ณ  ์ƒ๊ฐํ•œ๋‹ค. (์ „์ œ๋Š” Python, Jupyter notebook ๋˜๋Š” google colab ๊ฒฝํ—˜์ด ์žˆ๋‹ค๋Š” ๊ฒƒ.)

7๊ฐœ์˜ ๋Œ“๊ธ€

comment-user-thumbnail
2024๋…„ 4์›” 29์ผ

์œ ๋ฃŒ๋กœ ๊ฒฐ์ œํ•ด์•ผ ํ•˜๋Š” ๊ฑฐ ๋งž์ฃ ?

2๊ฐœ์˜ ๋‹ต๊ธ€
comment-user-thumbnail
2024๋…„ 5์›” 7์ผ

์™€ ์ด์ข‹์€ ๊ธ€์„ ๊ณผ์ œํ…Œ์ŠคํŠธ ์ดํ›„์— ๋ดค๋„ค์š” ! ใ… ใ…  ๋ฐ์ด์ฝ˜์—์„œ ๊ด‘๊ณ ๋น„ ๋“œ๋ ค์•ผํ• ๊ฑฐ๊ฐ™์Šต๋‹ˆ๋‹ค !!! ๊ทธ๋‚˜์ €๋‚˜ ๋‹ค๋ฅธ ํ›„๊ธฐ๋“ค๋ณด๋ฉด ๊ทธ๋ฆฌ๋“œ์„œ์น˜๋‚˜ ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ ํŠœ๋‹ ๋“ฑ๋“ฑ ๊ฝค ๊ณ ๋„ํ™”๋ฅผ ๋งŽ์ด ํ•˜๋˜๋ฐ ๋ชจ๋ธํ•˜๋‚˜์ •๋„๋กœ ์ •ํ™•๋„ 80์ •๋„ ๋‚˜์˜ค๋ฉด ์ถฉ๋ถ„ํžˆ ํ†ต๊ณผํ• ์ˆ˜์žˆ๋Š” ๋‚œ์ด๋„์ผ๊นŒ์š” ? ๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค :)

1๊ฐœ์˜ ๋‹ต๊ธ€