ML_Decision Tree

wnsdnlยท2025๋…„ 3์›” 10์ผ

ML ๋จธ์‹ ๋Ÿฌ๋‹

๋ชฉ๋ก ๋ณด๊ธฐ
8/11

๐Ÿ“Œ ๊ฒฐ์ • ํŠธ๋ฆฌ (Decision Tree)

๐Ÿ“ ๊ฒฐ์ • ํŠธ๋ฆฌ

๊ฒฐ์ • ํŠธ๋ฆฌ๋Š” ์˜ˆ/์•„๋‹ˆ์˜ค๋กœ ๋‹ตํ•  ์ˆ˜ ์žˆ๋Š” ์–ด๋–ค ์งˆ๋ฌธ๋“ค์ด ์žˆ๊ณ , ๊ทธ ์งˆ๋ฌธ๋“ค์˜ ๋‹ต์„ ๋”ฐ๋ผ๊ฐ€๋ฉด์„œ ๋ฐ์ดํ„ฐ๋ฅผ ๋ถ„๋ฅ˜ํ•˜๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด๋‹ค.

์˜ˆ๋ฅผ ๋“ค์–ด ๊ตํ†ต์‚ฌ๊ณ ๊ฐ€ ๋‚ฌ์„ ๋•Œ, ์šด์ „์ž์˜ ์ƒ์กด ์—ฌ๋ถ€๋ฅผ ์˜ˆ์ธกํ•˜๊ณ  ์‹ถ๋‹ค๊ณ  ํ•˜์ž. ๊ทธ๋Ÿฌ๋ฉด ๊ฒฐ์ • ํŠธ๋ฆฌ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์„ ์ˆ˜ ์žˆ๋‹ค.

์งˆ๋ฌธ๋“ค์— ๋‹ต์„ ํ•ด๊ฐ€๋ฉด์„œ ํ•œ ๋‹จ๊ณ„์‹ ๋‚ด๋ ค๊ฐˆ ์ˆ˜ ์žˆ๊ณ , ์œ„์—์„œ๋ถ€ํ„ฐ ์งˆ๋ฌธ๋“ค์— ๊ณ„์† ๋‹ต์„ ํ•˜๋ฉฐ ๋‚ด๋ ค๊ฐ€๋‹ค๊ฐ€ ๋ณด๋ผ์ƒ‰ ๋ฐ•์Šค๋“ค์— ๋„์ฐฉ์„ ํ•˜๋ฉด ํ•ด๋‹น ๋ถ„๋ฅ˜ ๊ฐ’์„ ๋ฆฌํ„ดํ•œ๋‹ค.

๋˜ํ•œ ๊ฒฐ์ • ํŠธ๋ฆฌ๋Š” ํ•œ ์†์„ฑ์„ ๋”ฑ ํ•œ ๋ฒˆ๋งŒ ์‚ฌ์šฉํ•ด์•ผ ๋˜๋Š” ๊ฑด ์•„๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด '์ฃผํ–‰ ์†๋„'๋ผ๋Š” ์†์„ฑ์ด ์žˆ๋‹ค๊ณ  ํ•  ๋•Œ ์•„๋ž˜์ฒ˜๋Ÿผ

์†๋„๊ฐ€ 100์„ ๋„˜์—ˆ๋Š”์ง€, 60์„ ๋„˜์—ˆ๋Š”์ง€ ์•ˆ ๋„˜์—ˆ๋Š”์ง€ ๋“ฑ๋“ฑ ํ•˜๋‚˜์˜ ์†์„ฑ์œผ๋กœ ์—ฌ๋Ÿฌ ๊ฐœ์˜ ์งˆ๋ฌธ์„ ๋งŒ๋“ค ์ˆ˜๋„ ์žˆ๋‹ค.

์ด์ฒ˜๋Ÿผ ํ•˜๋‚˜์˜ ์‹œ์ž‘ ์ง€์ ์—์„œ ํผ์ ธ๋‚˜๊ฐ€๋Š” ๋ชจ์Šต์ด ๋งˆ์น˜ ๋‚˜๋ฌด์™€ ๋น„์Šทํ•˜๊ณ , ํ•œ ๋‹จ๊ณ„ ๋‚ด๋ ค๊ฐˆ ๋•Œ๋งˆ๋‹ค ์™ผ์ชฝ์œผ๋กœ ๊ฐˆ์ง€ ์˜ค๋ฅธ์ชฝ์œผ๋กœ ๊ฐˆ์ง€ ์„ ํƒํ•˜๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด๊ธฐ ๋•Œ๋ฌธ์— ์ด๋ฆ„์ด ๊ฒฐ์ • ํŠธ๋ฆฌ์ธ ๊ฒƒ์ด๋‹ค.

๊ฒฐ์ • ํŠธ๋ฆฌ ๊ด€๋ จ ์šฉ์–ด๋Š” ์•„๋ž˜์™€ ๊ฐ™๋‹ค.

์ผ๋‹จ ๋ฐ•์Šค ํ•˜๋‚˜ํ•˜๋‚˜๋ฅผ '๋…ธ๋“œ'๋ผ๊ณ  ํ•˜๋Š”๋ฐ, ๊ฐ€์žฅ ์œ„์— ์žˆ๋Š” ์งˆ๋ฌธ ๋…ธ๋“œ๋Š” ๋‚˜๋ฌด์˜ ๋ฟŒ๋ฆฌ๋ผ๊ณ  ํ•ด์„œ root ๋…ธ๋“œ๋ผ๊ณ  ํ•œ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ํŠธ๋ฆฌ์˜ ๊ฐ€์žฅ ๋์— ์žˆ๋Š” ๋…ธ๋“œ๋“ค์€ leaf ๋…ธ๋“œ๋ผ๊ณ  ํ•œ๋‹ค. leaf ๋…ธ๋“œ๋Š” ํ•ญ์ƒ ์‚ฌ๋ง/์ƒ์กด๊ณผ ๊ฐ™์€ ํŠน์ • ์˜ˆ์ธก๊ฐ’์„ ๊ฐ–๊ณ  ์žˆ๊ณ , ๋‚˜๋จธ์ง€ ๋…ธ๋“œ๋“ค์€ ์˜ˆ/์•„๋‹ˆ์˜ค๋กœ ๋‹ตํ•  ์ˆ˜ ์žˆ๋Š” ์งˆ๋ฌธ์„ ๊ฐ–๊ณ  ์žˆ๋‹ค.

๐Ÿ“ ์ง€๋‹ˆ ๋ถˆ์ˆœ๋„(Gini Impurity)

์„ ํ˜• ํšŒ๊ท€ ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ๋ชฉ์ ์ด ํ•™์Šต ๋ฐ์ดํ„ฐ๋ฅผ ๊ฐ€์žฅ ์ž˜ ๋‚˜ํƒ€๋‚ผ ์ˆ˜ ์žˆ๋Š” ์ผ์ฐจ์‹์„ ์ฐพ๋Š” ๊ฑฐ์˜€๋‹ค๋ฉด, ๊ฒฐ์ • ํŠธ๋ฆฌ์˜ ๋ชฉ์ ์€ ํ•™์Šต ๋ฐ์ดํ„ฐ๋ฅผ ์ง์ ‘ ๋ถ„๋ฅ˜ํ•ด๋ณด๋ฉด์„œ, ๋ฐ์ดํ„ฐ๋“ค์„ ๊ฐ€์žฅ ์ž˜ ๋ถ„๋ฅ˜ํ•  ์ˆ˜ ์žˆ๋Š” ๋…ธ๋“œ(๊ธฐ์ค€)๋“ค์„ ์ฐพ์•„๋‚ด๋Š” ๊ฒƒ์ด๋‹ค. ์ฆ‰, ๊ฒฐ๋ก ์ ์œผ๋ก  ์ตœ์ ์˜ ํŠธ๋ฆฌ ๊ตฌ์กฐ๋ฅผ ์ฐพ๋Š” ๊ฒƒ์ด๋‹ค.

์ตœ์ ์˜ ํŠธ๋ฆฌ ๊ตฌ์กฐ๋ฅผ ์ฐพ๊ธฐ ์œ„ํ•ด์„  ์–ด๋–ค ์œ„์น˜์— ๋ฌด์Šจ ๋…ธ๋“œ๋“ค์ด ์žˆ์–ด์•ผ ์ข‹๊ณ  ๋‚˜์œ์ง€ ์ฆ‰, ์ข‹๊ณ  ๋‚˜์จ์˜ ํŒ๋‹จ ๊ธฐ์ค€์ด ์žˆ์–ด์•ผ ํ•˜๋Š”๋ฐ ์„ ํ˜• ํšŒ๊ท€์—์„œ๋Š” ์ด๊ฑธ ์†์‹ค ํ•จ์ˆ˜๋ฅผ ํ†ตํ•ด์„œ ํ–ˆ๋‹ค๋ฉด ๊ฒฐ์ • ํŠธ๋ฆฌ์—์„œ๋Š” ์ด๊ฑธ ์ง€๋‹ˆ ๋ถˆ์ˆœ๋„, ์˜์–ด๋กœ๋Š” Gini Impurity๋ฅผ ํ†ตํ•ด์„œ ํ•œ๋‹ค. (์•คํŠธ๋กœํ”ผ(Entropy)๋กœ๋„ ํ•  ์ˆ˜ ์žˆ๋‹ค.)

์ง€๋‹ˆ ๋ถˆ์ˆœ๋„๋Š” ๋ฐ์ดํ„ฐ ์…‹ ์•ˆ์— ์„œ๋กœ ๋ฐ์ดํ„ฐ๋“ค์ด ์–ผ๋งˆ๋‚˜ ์„ž์—ฌ์žˆ๋Š”์ง€๋ฅผ ๋‚˜ํƒ€๋‚ธ๋‹ค. ์ˆ˜์‹์œผ๋กœ ๋‚˜ํƒ€๋‚ด๋ฉด ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค. (CC๋Š” ํด๋ž˜์Šค์˜ ๊ฐœ์ˆ˜๋ฅผ ์˜๋ฏธํ•จ.)

GI=1โˆ’โˆ‘i=1C(pi)2GI = 1 - \sum_{i=1}^{C}(p_i)^2

์˜ˆ๋ฅผ ๋“ค์–ด ๋…๊ฐ ๋ฐ์ดํ„ฐ ์…‹ 100๊ฐœ์—์„œ ๋…๊ฐ์ธ ๋ฐ์ดํ„ฐ๋Š” 70๊ฐœ, ์ผ๋ฐ˜ ๊ฐ๊ธฐ์ธ ๋ฐ์ดํ„ฐ๋Š” 30๊ฐœ๋ผ๊ณ  ํ•˜์ž. ๊ทธ๋ ‡๋‹ค๋ฉด ์ง€๋‹ˆ ๋ถˆ์ˆœ๋„๋Š”

GI=1โˆ’((p1)2+(p2)2)GI = 1 - ((p_1)^2 + (p_2)^2)
GI=1โˆ’((70100)2+(30100)2)=0.42GI = 1 - ((\frac{70}{100})^2 + (\frac{30}{100})^2) = 0.42

๊ฐ€ ๋  ๊ฒƒ์ด๋‹ค.

๋ฐ์ดํ„ฐ ์…‹์—์„œ ๋…๊ฐ์ธ ๋ฐ์ดํ„ฐ๋งŒ 100๊ฐœ๋ผ๋ฉด ๋ฐ์ดํ„ฐ๋“ค์ด ์„ž์—ฌ์žˆ์ง€ ์•Š์€ ๊ฒƒ์ด๋‹ˆ ์ง€๋‹ˆ ๋ถˆ์ˆœ๋„๋Š” 0์ด๋‹ค. ์ง€๋‹ˆ ๋ถˆ์ˆœ๋„๊ฐ€ ๋‚ฎ๋‹ค๋Š” ๊ฒƒ์€ ๋ฐ์ดํ„ฐ๋“ค์ด ํ•˜๋‚˜์˜ ๋ถ„๋ฅ˜์— ์ง‘์ค‘๋ผ์žˆ๋‹ค๋Š” ๊ฒƒ์„ ์˜๋ฏธํ•œ๋‹ค.
๋ฐ˜๋Œ€๋กœ ๋ฐ์ดํ„ฐ๊ฐ€ ์ •ํ™•ํ•˜๊ฒŒ 50๊ฐœ์”ฉ ๋ฐ˜๋ฐ˜ ์„ž์—ฌ์žˆ๋‹ค๋ฉด ์ง€๋‹ˆ ๋ถˆ์ˆœ๋„๋Š” 0.5๊ฐ€ ๋  ๊ฒƒ์ด๋‹ค. ์ด์ง„ ๋ถ„๋ฅ˜ ๊ธฐ์ค€์œผ๋กœ ์„ž์—ฌ์žˆ๋Š” ๋ฐ์ดํ„ฐ ๋น„์œจ์ด 50:50์ผ ๋•Œ ์ง€๋‹ˆ ๋ถˆ์ˆœ๋„๋Š” ์ตœ๋Œ€๊ฐ€ ๋œ๋‹ค.

์ •๋ฆฌํ•˜์ž๋ฉด ์ง€๋‹ˆ ๋ถˆ์ˆœ๋„๊ฐ€ ์ž‘์„์ˆ˜๋ก ๋ฐ์ดํ„ฐ ์…‹์ด ์ˆœ์ˆ˜ํ•˜๊ณ , ํด์ˆ˜๋ก ๋ฐ์ดํ„ฐ ์…‹์ด ๋ถˆ์ˆœํ•˜๋‹ค.

๐Ÿ“ ๊ฒฐ์ • ํŠธ๋ฆฌ ๋…ธ๋“œ ์ •ํ•˜๊ธฐ

๊ทธ๋Ÿฌ๋ฉด ์ด์ œ ์ง€๋‹ˆ ๋ถˆ์ˆœ๋„๋ฅผ ์ด์šฉํ•ด์„œ ๊ฒฐ์ • ํŠธ๋ฆฌ์˜ ๋…ธ๋“œ๋ฅผ ์ •ํ•ด๋ณด์ž.

์ผ๋‹จ ๋‹ค์Œ๊ณผ ๊ฐ™์€ ๋…๊ฐ ํ™˜์ž ๋ฐ์ดํ„ฐ ์…‹์ด ์žˆ๋‹ค๊ณ  ๊ฐ€์ •ํ•˜์ž.

๋ฐ์ดํ„ฐ ์…‹์€ ๋ณด์ด๋Š” ๊ฒƒ์ฒ˜๋Ÿผ ๊ณ ์—ด, ๊ธฐ์นจ, ๋ชธ์‚ด์ด ์žˆ๋Š”์ง€ ์—†๋Š”์ง€๋ฅผ ์†์„ฑ์œผ๋กœ, ํ™˜์ž๊ฐ€ ๋…๊ฐ์ธ์ง€ ์•„๋‹Œ์ง€๋ฅผ ๋ชฉํ‘œ ๋ณ€์ˆ˜๋กœ ๊ฐ–๋Š”๋‹ค.
๊ทธ๋ฆฌ๊ณ  ํ•™์Šต ๋ฐ์ดํ„ฐ๋ฅผ ์ง์ ‘ ํ•œ ๋ฒˆ ๋ถ„๋ฅ˜ํ•ด๋ณด๋ฉด์„œ ๊ฒฐ์ • ํŠธ๋ฆฌ๋ฅผ ๋งŒ๋“ค์–ด๋ณด๊ณ , ์ด ๊ฒฐ์ • ํŠธ๋ฆฌ๋ฅผ ์จ์„œ ๋ชธ ์ƒํƒœ๋กœ ๋…๊ฐ์ด ์žˆ๋Š”์ง€ ์—†๋Š”์ง€๋ฅผ ์˜ˆ์ธกํ•˜๋ ค๊ณ  ํ•œ๋‹ค.

์ผ๋‹จ ๊ฒฐ์ • ํŠธ๋ฆฌ๋ฅผ ๋งŒ๋“ค ๋•Œ ์ฒ˜์Œ์—๋Š” root ๋…ธ๋“œ๋ฅผ ์ •ํ•ด์•ผ ํ•œ๋‹ค. root ๋…ธ๋“œ๊ฐ€ ๋  ์ˆ˜ ์žˆ๋Š” ๊ฒƒ์€ ๋ฌด์—‡์ด ์žˆ์„๊นŒ?

  • Case 1) ๋ถ„๋ฅ˜ ๋…ธ๋“œ๋ฅผ ๋ฐ”๋กœ ๋งŒ๋“ ๋‹ค.
    ์งˆ๋ฌธ ๋…ธ๋“œ๋ฅผ ๋งŒ๋“ค์ง€ ์•Š๊ณ  ๋ฐ”๋กœ ๋ถ„๋ฅ˜ ๋…ธ๋“œ๋ฅผ ๋งŒ๋“ค ์ˆ˜ ์žˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ์ฒ˜์Œ๋ถ€ํ„ฐ ๊ทธ๋ƒฅ ๋ชจ๋“  ๋ฐ์ดํ„ฐ๋Š” ๋…๊ฐ์ด๋‹ค(or ์ผ๋ฐ˜ ๊ฐ๊ธฐ๋‹ค)๋ผ๊ณ  ํ•  ์ˆ˜ ์žˆ๋‹ค.

  • Case 2) ์งˆ๋ฌธ ๋…ธ๋“œ๋ฅผ ๋งŒ๋“ ๋‹ค
    โ€œ๊ณ ์—ด์ด ์žˆ๋‚˜์š”?โ€, โ€œ๊ธฐ์นจ์ด ์žˆ๋‚˜์š”?โ€, โ€œ๋ชธ์‚ด์ด ์žˆ๋‚˜์š”?โ€ ์ด ์„ธ ์งˆ๋ฌธ ์ค‘ ํ•˜๋‚˜๋ฅผ ๋…ธ๋“œ๋กœ ๋งŒ๋“ค์–ด ๋ถ„๋ฅ˜ํ•ด๋ณผ ์ˆ˜ ์žˆ๋‹ค.

์ด ์„ ํƒ์ง€๋“ค ์ค‘ ์–ด๋–ค ๊ฑธ ๊ณจ๋ผ์•ผ ๋ ๊นŒ? ๊ฒฐ์ • ํŠธ๋ฆฌ๋ฅผ ๋งŒ๋“ค ๋•Œ๋Š” ํ•ญ์ƒ ํ˜„์žฌ ์ƒํ™ฉ์—์„œ ๊ฐ€์žฅ โ€œ์ข‹์€โ€ ๋…ธ๋“œ๋ฅผ ๊ณจ๋ผ์•ผ ํ•œ๋‹ค. ์ด๋•Œ โ€œ์ข‹๋‹ค/์•ˆ ์ข‹๋‹คโ€์˜ ๊ธฐ์ค€์€ ์œ„์—์„œ ๋ฐฐ์šด ์ง€๋‹ˆ ๋ถˆ์ˆœ๋„๋ฅผ ํ™œ์šฉํ•œ๋‹ค.

์ผ๋‹จ ๋ถ„๋ฅ˜ ๋…ธ๋“œ๋ฅผ ๋ฐ”๋กœ ๋งŒ๋“œ๋Š” ๊ฒฝ์šฐ์— ๋Œ€ํ•ด์„œ ์‚ดํŽด๋ณด์ž.

๐Ÿ’กCase 1) ๋ถ„๋ฅ˜ ๋…ธ๋“œ๋ฅผ ๋ฐ”๋กœ ๋งŒ๋“ ๋‹ค

root ๋…ธ๋“œ๋ฅผ ๋ถ„๋ฅ˜ ๋…ธ๋“œ๋กœ ๋งŒ๋“ ๋‹ค๊ณ  ๊ฐ€์ •ํ•˜์ž.
์ผ๋‹จ ํ•™์Šต์— ์‚ฌ์šฉํ•˜๋Š” ๋ฐ์ดํ„ฐ ์ˆ˜๋Š” 90๊ฐœ์ธ๋ฐ, root ๋…ธ๋“œ๋Š” ๊ฐ€์žฅ ์œ„์— ์žˆ๋Š” ๋…ธ๋“œ๋‹ˆ๊นŒ ๋ชจ๋“  ๋ฐ์ดํ„ฐ๊ฐ€ ๊ฑฐ์ณ์•ผ ๋˜๋Š” ๋…ธ๋“œ์ด๋ฏ€๋กœ ์ด 90๊ฐœ๋ฅผ ๋ชจ๋‘ ์‚ฌ์šฉํ•œ๋‹ค.

ํ•™์Šต ๋ฐ์ดํ„ฐ๋Š” ์•„๋ž˜์™€ ๊ฐ™์ด ๋…๊ฐ์ธ ์‚ฌ๋žŒ์ด 50๋ช…, ์•„๋‹Œ ์‚ฌ๋žŒ์ด 40๋ช…์ด ์žˆ๋‹ค.

๋ถ„๋ฅ˜ ๋…ธ๋“œ๋ฅผ ํ–ˆ์„ ๋•Œ ์ตœ๋Œ€ํ•œ ๋งŽ์€ ๋ฐ์ดํ„ฐ๋ฅผ ๋งž๊ฒŒ ๋ถ„๋ฅ˜ํ•ด์•ผ ์ข‹์€ ๊ฒƒ์ด๋‹ค. ๊ทธ ๋ง์€ ์—ฌ๊ธฐ ์žˆ๋Š” ๋ชจ๋“  ๋ฐ์ดํ„ฐ 90๊ฐœ๋ฅผ ํ•˜๋‚˜์˜ ๋ถ„๋ฅ˜(๋…๊ฐ or ์ผ๋ฐ˜ ๊ฐ๊ธฐ)๋กœ ์˜ˆ์ธก์„ ํ–ˆ์„ ๋•Œ, ์ตœ๋Œ€ํ•œ ๋งŽ์ด ๋งž์•„์•ผ ๋œ๋‹ค๋Š” ๊ฒƒ์ด๋‹ค.

์ผ๋‹จ ๋ถ„๋ฅ˜ ๋…ธ๋“œ๋ฅผ ๋งŒ๋“ค ๋•Œ๋Š” ํ•ญ์ƒ ๋ฐ์ดํ„ฐ ์…‹์—์„œ ๊ฐ€์žฅ ๋งŽ์€ ๋ถ„๋ฅ˜๋กœ ๋งŒ๋“ ๋‹ค. ์ง€๊ธˆ ๊ฐ™์€ ๊ฒฝ์šฐ๋Š” ๋…๊ฐ ๋ฐ์ดํ„ฐ๊ฐ€ ์ผ๋ฐ˜ ๊ฐ๊ธฐ ๋ฐ์ดํ„ฐ๋ณด๋‹ค ๋งŽ๊ธฐ ๋•Œ๋ฌธ์— ๋…๊ฐ ๋…ธ๋“œ๋ฅผ ๋ถ„๋ฅ˜ ๋…ธ๋“œ๋กœ ๊ณ ๋ฅธ๋‹ค.

๊ทธ๋Ÿผ ์ด ๋…๊ฐ ๋…ธ๋“œ๋Š” ์ •ํ™•ํžˆ ์–ผ๋งˆ๋‚˜ ์ข‹์€ ๊ฑธ๊นŒ?

์ข‹์€ ๋…๊ฐ ๋…ธ๋“œ๋Š” ์ตœ๋Œ€ํ•œ ๋งŽ์€ ํ•™์Šต ๋ฐ์ดํ„ฐ๋ฅผ ๋งž์ถœ ์ˆ˜ ์žˆ์–ด์•ผ ํ•˜๋Š”๋ฐ, ๊ทธ๋Ÿฌ๋ ค๋ฉด ์ด ๋ฐ์ดํ„ฐ ์…‹ ์•ˆ์— ์ฒ˜์Œ๋ถ€ํ„ฐ ๋…๊ฐ ๋ฐ์ดํ„ฐ๊ฐ€ ๋งŽ์•„์•ผํ•œ๋‹ค. ๋‹ค๋ฅด๊ฒŒ ํ‘œํ˜„ํ•˜๋ฉด ๋ถˆ์ˆœ๋„๊ฐ€ ๋‚ฎ์€, ์ˆœ์ˆ˜ํ•œ ๋ฐ์ดํ„ฐ ์…‹์ด์–ด์•ผ ํ•œ๋‹ค.

๊ทผ๋ฐ ๋…๊ฐ ๋…ธ๋“œ๋ฅผ ๋ถ„๋ฅ˜ ๋…ธ๋“œ๋กœ ์„ค์ •ํ–ˆ์„ ๋•Œ ๋ถˆ์ˆœ๋„๋ฅผ ๊ณ„์‚ฐํ•ด๋ณด๋ฉด 0.494๋กœ ๊ฝค ๋†’์€ ํŽธ์ด๋‹ค.

๋ฐ์ดํ„ฐ๊ฐ€ ๋ถˆ์ˆœํ•  ๋•Œ ์ฒ˜์Œ๋ถ€ํ„ฐ ๋ถ„๋ฅ˜ ๋…ธ๋“œ๋กœ ๋งŒ๋“ค๋ฉด ์„ฑ๋Šฅ์ด ๋ณ„๋กœ ์•ˆ ์ข‹๋‹ค๋Š” ๊ฒƒ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋‹ค. ์œก์•ˆ์œผ๋กœ ๋ด๋„ ์ „์ฒด ๋ฐ์ดํ„ฐ 90๊ฐœ ์ค‘์— 50๊ฐœ๋Š” ๋งž๊ณ  40๊ฐœ๋Š” ํ‹€๋ ค๋ฒ„๋ฆฌ๋Š” ์…ˆ์ด๋‹ค.

๋”ฐ๋ผ์„œ ๋ถ„๋ฅ˜ ๋…ธ๋“œ๋ฅผ root ๋…ธ๋“œ๋กœ ํ•  ๋•Œ๋Š” ๋ฐ์ดํ„ฐ๊ฐ€ ์ฒ˜์Œ๋ถ€ํ„ฐ ์ž˜ ๋ถ„๋ฅ˜๋˜์–ด ์žˆ์„ ๋•Œ ํšจ๊ณผ์ ์ด๋‹ค.

๐Ÿ’กCase 2) ์งˆ๋ฌธ ๋…ธ๋“œ๋ฅผ ๋งŒ๋“ ๋‹ค

์—ฌ๋Ÿฌ ์งˆ๋ฌธ ๋…ธ๋“œ ์ค‘ โ€œ๊ณ ์—ด์ด ์žˆ๋‚˜์š”?โ€๋กœ ๋…ธ๋“œ๋กœ ๋งŒ๋“œ๋Š” ๊ฒฝ์šฐ๋ฅผ ์ƒ๊ฐํ•ด๋ณด์ž. ๊ฒฐ์ • ํŠธ๋ฆฌ์—์„œ ์ข‹์€ ์งˆ๋ฌธ์€ ๋ฐ์ดํ„ฐ๋ฅผ ์ž˜ ๋‚˜๋ˆ„๋Š” ์งˆ๋ฌธ์ด๋‹ค.

๋งŒ์•ฝ โ€œ๊ณ ์—ด์ด ์žˆ๋‚˜์š”?โ€๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ๋‚˜๋ˆด์„ ๋•Œ, ์ •ํ™•ํ•˜๊ฒŒ ๋…๊ฐ๊ณผ ์ผ๋ฐ˜ ๊ฐ๊ธฐ๋ฅผ ๋ถ„๋ฅ˜ํ–ˆ๋‹ค๋ฉด ์ด ์งˆ๋ฌธ ๋…ธ๋“œ๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ์—„์ฒญ ์ž˜ ๋‚˜๋ˆ„๋Š” ์ข‹์€ ๋…ธ๋“œ์ด๋‹ค. ๊ทธ๋ฆผ์œผ๋กœ ๋ณด๋ฉด ์•„๋ž˜์™€ ๊ฐ™๋‹ค.

๊ทผ๋ฐ ๋งŒ์•ฝ ์•„๋ž˜ ๊ทธ๋ฆผ์ฒ˜๋Ÿผ ๋‚˜๋‰œ ๋ฐ์ดํ„ฐ์— ๋‹ค์‹œ ๋…๊ฐ๊ณผ ์ผ๋ฐ˜ ๊ฐ๊ธฐ๊ฐ€ ๋งŽ์ด ์„ž์—ฌ ์žˆ๋‹ค๋ฉด ๊ทธ ์งˆ๋ฌธ ๋…ธ๋“œ๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ์ž˜ ๋ถ„๋ฅ˜ํ•˜์ง€ ๋ชปํ•˜๋Š” ๊ฒƒ์ด๋ฏ€๋กœ ์ข‹์ง€ ์•Š์€ ๋…ธ๋“œ์ด๋‹ค.

์ •๋ฆฌํ•˜์ž๋ฉด ์ข‹์€ ์งˆ๋ฌธ ๋…ธ๋“œ๋Š” ์„ž์—ฌ์žˆ๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ์ž˜ ๋‚˜๋ˆ ์„œ ์ ์  ๋” ๋ถ„๋ฅ˜ํ•˜๊ธฐ ์‰ฝ๊ฒŒ ๋งŒ๋“ค์–ด ์ฃผ๊ณ , ๋˜ ๋‚˜๋‰œ ๋ฐ์ดํ„ฐ ์…‹๋“ค์˜ ์ง€๋‹ˆ ๋ถˆ์ˆœ๋„๊ฐ€ ๋‚ฎ์„์ˆ˜๋ก ์ข‹์€ ์งˆ๋ฌธ ๋…ธ๋“œ์ด๋‹ค.

๊ทธ๋Ÿฌ๋ฉด ์งˆ๋ฌธ ๋…ธ๋“œ์˜ ์„ฑ๋Šฅ์„ ์ˆ˜์น˜์ ์œผ๋กœ ํ‰๊ฐ€ํ•ด๋ณด์ž.
๋จผ์ € โ€œ๊ณ ์—ด์ด ์žˆ๋‚˜์š”?โ€๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ๋‚˜๋ˆด์„ ๋•Œ, ๋‹ค์Œ๊ณผ ๊ฐ™์ด ๋ถ„๋ฅ˜๊ฐ€ ๋˜์—ˆ๋‹ค๊ณ  ๊ฐ€์ •ํ•˜์ž.

๊ณ ์—ด์ด ์žˆ๋Š” ์‚ฌ๋žŒ๋“ค๋กœ ๋ถ„๋ฅ˜๋œ ๋ฐ์ดํ„ฐ์…‹ 50๋ช… ์ค‘์—์„œ ๋…๊ฐ์ธ ์‚ฌ๋žŒ์€ 40๋ช…, ์ผ๋ฐ˜ ๊ฐ๊ธฐ์ธ ์‚ฌ๋žŒ์€ 10๋ช…์ด๋‹ค. ์ง€๋‹ˆ ๋ถˆ์ˆœ๋„๋ฅผ ๊ณ„์‚ฐํ•ด๋ณด๋ฉด 0.32๊ฐ€ ๋‚˜์˜จ๋‹ค.

๊ณ ์—ด์ด ์—†๋Š” ์‚ฌ๋žŒ๋“ค๋กœ ๋ถ„๋ฅ˜๋œ ๋ฐ์ดํ„ฐ์…‹ 40๋ช… ์ค‘์—์„œ ๋…๊ฐ์ธ ์‚ฌ๋žŒ์€ 10๋ช…, ์ผ๋ฐ˜ ๊ฐ๊ธฐ์ธ ์‚ฌ๋žŒ์€ 30๋ช…์ด๋‹ค. ์ง€๋‹ˆ ๋ถˆ์ˆœ๋„๋ฅผ ๊ณ„์‚ฐํ•ด๋ณด๋ฉด 0.375๊ฐ€ ๋‚˜์˜จ๋‹ค.

๊ฐ๊ฐ ์ง€๋‹ˆ ๋ถˆ์ˆœ๋„๋ฅผ ๊ณ„์‚ฐํ–ˆ์œผ๋ฏ€๋กœ ์ด๊ฑธ ํ‰๊ท ๋‚ด์–ด ๊ณ„์‚ฐํ•˜๋ฉด โ€œ๊ณ ์—ด์ด ์žˆ๋‚˜์š”?โ€๋ผ๋Š” ์งˆ๋ฌธ ๋…ธ๋“œ์˜ ์„ฑ๋Šฅ์„ ์ˆ˜์น˜ํ™” ํ•  ์ˆ˜ ์žˆ๋‹ค.

50โˆ—GIleft+40โˆ—GIright50+40\frac{50 * GI_{left} + 40 * GI_{right}}{50 + 40}

ํ‰๊ท ์„ ๋‚ผ ๋•Œ ๊ฐ ์ง€๋‹ˆ ๋ถˆ์ˆœ๋„์— ํ•ด๋‹น ๋ฐ์ดํ„ฐ์˜ ํฌ๊ธฐ๋งŒํผ์„ ๊ฐ€์ค‘์น˜๋กœ ์ค€ ๋’ค ์ด๋“ค์„ ๋ชจ๋‘ ๋”ํ•˜๊ณ , ๊ทธ๊ฑธ ์ „์ฒด ๋ฐ์ดํ„ฐ ์…‹์œผ๋กœ ๋‚˜๋ˆ„๋ฉด ๋œ๋‹ค.
์ด๋ ‡๊ฒŒ ํ•ด์„œ ๊ณ„์‚ฐํ•œ โ€œ๊ณ ์—ด์ด ์žˆ๋‚˜์š”?โ€ ์งˆ๋ฌธ์œผ๋กœ ๋‚˜๋ˆ ์ง„ ๋ฐ์ดํ„ฐ ์…‹๋“ค์˜ ํ‰๊ท  ์ง€๋‹ˆ ๋ถˆ์ˆœ๋„๋Š” ์•ฝ 0.344๊ฐ€ ๋œ๋‹ค. ์ฆ‰, ์ด ์งˆ๋ฌธ์ด ์–ผ๋งˆ๋‚˜ ๋ฐ์ดํ„ฐ๋ฅผ ์ž˜ ๋‚˜๋ˆ„๋Š”์ง€๋ฅผ ์ˆ˜์น˜๋ฅผ ๋‚˜ํƒ€๋‚ด๋ฉด 0.344๋ผ๋Š” ๊ฒƒ์ด๋‹ค. ์ด ํ‰๊ท  ์ง€๋‹ˆ ๋ถˆ์ˆœ๋„๋Š” ๋‚ฎ์„ ์ˆ˜๋ก ์ข‹๊ณ , ๋†’์„ ์ˆ˜๋ก ์ข‹์ง€ ์•Š๋‹ค.
์ด ๊ณผ์ •์„ ํ•˜๋‚˜์˜ ๊ทธ๋ฆผ ์•ˆ์— ๋‹ด์œผ๋ฉด ์•„๋ž˜์™€ ๊ฐ™๋‹ค.

๐Ÿ’ก๋…ธ๋“œ ์ •ํ•˜๊ธฐ

์œ„์—์„œ๋Š” ๋ถ„๋ฅ˜ ๋…ธ๋“œ๋ฅผ ์‚ฌ์šฉํ–ˆ์„ ๋•Œ์™€ ์งˆ๋ฌธ ๋…ธ๋“œ๋ฅผ ์‚ฌ์šฉํ–ˆ์„ ๋•Œ์˜ ์ง€๋‹ˆ ๋ถˆ์ˆœ๋„๋ฅผ ์ธก์ •ํ–ˆ์—ˆ๋‹ค. ์ด์ œ root ๋…ธ๋“œ๋ฅผ ๊ณ ๋ฅด๊ธฐ ์œ„ํ•ด์„œ๋Š” ์ด ๋ชจ๋“  ๊ฒฝ์šฐ๋“ค ์ค‘์—์„œ ์ง€๋‹ˆ ๋ถˆ์ˆœ๋„๊ฐ€ ๊ฐ€์žฅ ๋‚ฎ๊ฒŒ ๋‚˜์˜ค๋Š” ๋…ธ๋“œ๋ฅผ ์„ ํƒํ•ด์ฃผ๋ฉด ๋œ๋‹ค.
์ผ๋‹จ ์œ„์—์„œ๋Š” โ€œ๊ณ ์—ด์ด ์žˆ๋‚˜์š”?โ€ ์งˆ๋ฌธ ๋…ธ๋“œ์— ๋Œ€ํ•œ ์ง€๋‹ˆ ๋ถˆ์ˆœ๋„๋งŒ ๊ณ„์‚ฐํ•ด์ฃผ์—ˆ๋Š”๋ฐ ๋‚˜๋จธ์ง€ ์งˆ๋ฌธ๋“ค์— ๋Œ€ํ•œ ์ง€๋‹ˆ ๋ถˆ์ˆœ๋„๋„ ๊ณ„์‚ฐํ•˜๊ณ  ๋ชจ๋“  ๊ฒฝ์šฐ๋“ค์„ ํ•จ๊ป˜ ๋ณด๋ฉด ์•„๋ž˜์™€ ๊ฐ™๋‹ค.

์—ฌ๊ธฐ์„œ ์ง€๋‹ˆ ๋ถˆ์ˆœ๋„๊ฐ€ ๊ฐ€์žฅ ๋‚ฎ์€ ๊ฒƒ์€ โ€œ๋ชธ์‚ด์ด ์žˆ๋‚˜์š”?โ€ ์งˆ๋ฌธ์ด๋‹ค. ๋”ฐ๋ผ์„œ ์ด๊ฑธ root ๋…ธ๋“œ๋กœ ๊ณจ๋ผ์ฃผ๋ฉด ๋œ๋‹ค.

๊ฐ ๊ฒฝ์šฐ ๋ณ„๋กœ ์ง€๋‹ˆ ๋ถˆ์ˆœ๋„๊ฐ€ ๋‚ฎ๋‹ค๋Š” ๊ฒƒ์˜ ์˜๋ฏธ๋ฅผ ์ •๋ฆฌํ•ด๋ณด๋ฉด:

  • ๋ถ„๋ฅ˜ ๋…ธ๋“œ์˜ ๋ถˆ์ˆœ๋„๊ฐ€ ๊ฐ€์žฅ ์ž‘์œผ๋ฉด ์ด๋ฏธ ๋ฐ์ดํ„ฐ๊ฐ€ ์ž˜ ๋‚˜๋ˆ ์ ธ ์žˆ๊ธฐ ๋•Œ๋ฌธ์— ์žˆ๋Š” ๊ทธ๋Œ€๋กœ ๋ถ„๋ฅ˜ํ•ด๋„ ๋œ๋‹ค๋Š” ๋œป์ด๊ณ ,

  • ์งˆ๋ฌธ ๋…ธ๋“œ์˜ ๋ถˆ์ˆœ๋„๊ฐ€ ๊ฐ€์žฅ ์ž‘์œผ๋ฉด ์งˆ๋ฌธ์„ ํ†ตํ•ด์„œ ์ง€๊ธˆ ์žˆ๋Š” ๋ฐ์ดํ„ฐ ์…‹๋ณด๋‹ค ๋ถˆ์ˆœ๋„๋ฅผ ๋” ๋‚ฎ์ถœ ์ˆ˜ ์žˆ๋‹ค๋Š” ๋œป์ด๋‹ค.

๐Ÿ“ ๊ฒฐ์ • ํŠธ๋ฆฌ ์™„์„ฑํ•˜๊ธฐ

์ด์ œ ๋‚˜๋จธ์ง€ ๋…ธ๋“œ๋“ค๋„ ์œ„์—์„œ ๋ดค๋˜ ๋ฐฉ๋ฒ•๋“ค ๊ทธ๋Œ€๋กœ ์ ์šฉํ•ด๊ฐ€๋ฉด ๋œ๋‹ค. ์œ„์—์„œ root ๋…ธ๋“œ๋ฅผ โ€œ๋ชธ์‚ด์ด ์žˆ๋‚˜์š”?โ€๋กœ ํ–ˆ์œผ๋‹ˆ ๊ทธ ๋‹ค์Œ ์ƒํ™ฉ์€ ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.

์œ„์— ๋ณด์ด๋‹ค์‹œํ”ผ ๋ชธ์‚ด์ด ์žˆ๋ƒ๋Š” ์งˆ๋ฌธ์— '์˜ˆ'๋ผ๊ณ  ๋‹ตํ•˜๊ณ  ๋‚œ ํ›„ ๋‹ค์‹œ ๋…ธ๋“œ๋ฅผ ์ •ํ•  ๋•Œ๋Š” ํ•™์Šต ๋ฐ์ดํ„ฐ๊ฐ€ ๋ชธ์‚ด์ด ์žˆ๋Š” ๋ฐ์ดํ„ฐ๋“ค๋กœ ๋งŒ ๊ตฌ์„ฑ๋˜์–ด ์žˆ๋‹ค. ๋ฐ”๋€ ์ด ๋ฐ์ดํ„ฐ๋“ค๋กœ ๋‹ค์‹œ ์ด์ „์— ํ–ˆ๋˜ ์ง€๋‹ˆ ๋ถˆ์ˆœ๋„ ๋น„๊ต ๊ณผ์ •์„ ๊ฑฐ์น˜๋ฉด ๋œ๋‹ค.

๋งŒ์•ฝ ๋ชธ์‚ด์ด ์žˆ๋Š” 60๋ช…์˜ ์‚ฌ๋žŒ๋“ค ์ค‘์— ๋…๊ฐ์ธ ์‚ฌ๋žŒ์€ 50๋ช…, ์ผ๋ฐ˜ ๊ฐ๊ธฐ์ธ ์‚ฌ๋žŒ์€ 10๋ช…์ด๋ผ๊ณ  ํ•˜์ž. ๊ทธ๋ฆฌ๊ณ  ๋…๊ฐ์ธ ์‚ฌ๋žŒ์ด ๋” ๋งŽ์œผ๋‹ˆ ๋ชธ์‚ด์ด ์žˆ๋Š” ๋ฐ์ดํ„ฐ๋Š” ๋ชจ๋‘ ๋…๊ฐ์ด ์žˆ๋‹ค๊ณ  ๋ถ„๋ฅ˜ํ•ด๋ณด์ž. ์ฆ‰, ๋…๊ฐ์„ ๋ถ„๋ฅ˜ ๋…ธ๋“œ๋กœ ํ•ด๋ณด์ž.
์ด ๋•Œ์˜ ์ง€๋‹ˆ ๋ถˆ์ˆœ๋„๋ฅผ ๊ณ„์‚ฐํ•ด๋ณด๋ฉด 0.278์ด ๋‚˜์˜จ๋‹ค.

๋‹ค์Œ์€ ๊ณ ์—ด์ด ์žˆ๋Š”์ง€๋ฅผ ์ด์šฉํ•ด์„œ ๋‚˜๋ˆด์„ ๋•Œ์™€, ๊ธฐ์นจ์ด ์žˆ๋Š”์ง€๋ฅผ ์ด์šฉํ•ด์„œ ๋‚˜๋ˆด์„ ๋•Œ์˜ ๋ถˆ์ˆœ๋„๋ฅผ ๊ณ„์‚ฐํ•ด๋ณด์ž. ์ˆœ์„œ๋Œ€๋กœ 0.270, 0.3์ด ๋‚˜์˜จ๋‹ค.

๋น„๊ตํ•ด๋ดค์„ ๋•Œ, '๊ณ ์—ด์ด ์žˆ๋‚˜์š”?'๋ฅผ ์งˆ๋ฌธ ๋…ธ๋“œ๋กœ ์‚ฌ์šฉํ–ˆ์„ ๋•Œ๊ฐ€ ๊ฐ€์žฅ ์ง€๋‹ˆ ๋ถˆ์ˆœ๋„๊ฐ€ ๋‚ฎ๋‹ค. ๊ทธ๋Ÿฌ๋‹ˆ ์ด ์งˆ๋ฌธ์„ ๋…ธ๋“œ๋กœ ๋งŒ๋“ค์–ด์ฃผ๋ฉด ๋˜๋Š” ๊ฒƒ์ด๋‹ค. ์ด์ œ ๊ฒฐ์ • ํŠธ๋ฆฌ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์„ ๊ฒƒ์ด๋‹ค.

๋ฐฉ๊ธˆํ–ˆ๋˜ ์ด ๊ณผ์ •์„ ํŠธ๋ฆฌ์˜ ๋งจ ๋์— ์žˆ๋Š” leaf ๋…ธ๋“œ๋“ค์ด ๋ชจ๋‘ ๋ถ„๋ฅ˜ ๋…ธ๋“œ๊ฐ€ ๋  ๋•Œ๊นŒ์ง€ ๋ฐ˜๋ณตํ•ด ์ฃผ๋ฉด ๊ฒฐ์ • ํŠธ๋ฆฌ๋ฅผ ๋งŒ๋“ค ์ˆ˜ ์žˆ๋‹ค.

๐Ÿ’ก๊ฒฐ์ • ํŠธ๋ฆฌ ๊นŠ์ด

ํŠธ๋ฆฌ๊ฐ€ ๋ช‡ ์ธต๊นŒ์ง€ ๋‚ด๋ ค๊ฐ€๋Š”์ง€๋ฅผ ํŠธ๋ฆฌ์˜ ๊นŠ์ด๋ผ๊ณ  ํ‘œํ˜„ํ•˜๋Š”๋ฐ, '๊นŠ์ด 3 ์ด์ƒ ๋‚ด๋ ค๊ฐ€์ง€ ๋งˆ๋ผ!' ์ด๋ ‡๊ฒŒ ์ •ํ•ด์ค„ ์ˆ˜๋„ ์žˆ๋‹ค.

์ด๋Ÿด ๋• ๊ทธ๋ƒฅ ํŠน์ • ๊นŠ์ด๊นŒ์ง€ ๋‚ด๋ ค์˜ค๋ฉด ๋” ์ด์ƒ ์ง€๋‹ˆ ๋ถˆ์ˆœ๋„๋ฅผ ๋น„๊ตํ•˜์ง€ ์•Š๊ณ  ๋ถ„๋ฅ˜ ๋…ธ๋“œ๋ฅผ ๋งŒ๋“  ๋’ค์— ๋๋‚ด๋ฉด ๋œ๋‹ค.
์˜ˆ๋ฅผ ๋“ค์–ด ๊ณ ์—ด์ด ์žˆ๋Š” ๋ฐ์ดํ„ฐ ์…‹์—์„œ ๋…๊ฐ์ธ ์‚ฌ๋žŒ์ด ๋” ๋งŽ๋‹ค๋ฉด ๋…๊ฐ ๋…ธ๋“œ๋กœ ๋๋‚ด๋ฉด ๋˜๊ณ , ๊ณ ์—ด์ด ์—†๋Š” ๋ฐ์ดํ„ฐ ์…‹์—์„œ ์ผ๋ฐ˜ ๊ฐ๊ธฐ๊ฐ€ ๋” ๋งŽ๋‹ค๋ฉด ๊ทธ๊ณณ์€ ์ผ๋ฐ˜ ๊ฐ๊ธฐ ๋…ธ๋“œ๋กœ ๋๋‚ด๋ฉด ๋œ๋‹ค.

๐Ÿ’ก์†์„ฑ์ด ์ˆซ์žํ˜•์ผ ๋•Œ ์งˆ๋ฌธ ๋…ธ๋“œ

์ง€๊ธˆ๊นŒ์ง€ ๋ณธ ์†์„ฑ๋“ค์€ ๋ชจ๋‘ ์ฐธ ๊ฑฐ์ง“์œผ๋กœ ๋ฐ”ํƒ•ํ•œ ๋ถˆ๋ฆฐํ˜• ๋ฐ์ดํ„ฐ์˜€๋‹ค. ๊ทธ๋ ‡๊ธฐ ๋•Œ๋ฌธ์— ๊ทธ๋ƒฅ โ€œ๊ณ ์—ด์ด ์žˆ๋‚˜์š”?โ€ ์ด๋ ‡๊ฒŒ ํ•  ์ˆ˜ ์žˆ๋Š” ์งˆ๋ฌธ์ด ํ•˜๋‚˜๋ฐ–์— ์—†์—ˆ๋‹ค.

ํ•˜์ง€๋งŒ ์•„๋ž˜ ํ‘œ์—์„œ ๋ฐ์ดํ„ฐ๊ฐ€ ๊ฐ€์žฅ ์™ผ์ชฝ ์ฒด์˜จ ์†์„ฑ์ฒ˜๋Ÿผ ์ˆซ์žํ˜•์œผ๋กœ ์žˆ๋Š” ๊ฒฝ์šฐ์—๋Š” ๋งŒ๋“ค ์ˆ˜ ์žˆ๋Š” ์งˆ๋ฌธ์ด ์—„์ฒญ ๋งŽ๋‹ค.

์˜ˆ๋ฅผ ๋“ค์–ด ์ฒด์˜จ์ด โ€œ37.1๋„๋ฅผ ๋„˜๋‚˜์š”?โ€, ์ฒด์˜จ์ด โ€œ37.2๋„๋ฅผ ๋„˜๋‚˜์š”?โ€, ์ฒด์˜จ์ด โ€œ37.3๋„๋ฅผ ๋„˜๋‚˜์š”?โ€ ์ด๋ ‡๊ฒŒ ๋๋„ ์—†์ด ์งˆ๋ฌธ์ด ๋งŽ์„ ์ˆ˜ ์žˆ๋‹ค.

์ด๋ ‡๊ฒŒ ํ•˜๋‚˜์˜ ์†์„ฑ์—์„œ ๋งŒ๋“ค ์ˆ˜ ์žˆ๋Š” ์ˆ˜๋งŽ์€ ์งˆ๋ฌธ๋“ค ์ค‘์— ํ•˜๋‚˜๋ฅผ ๊ณ ๋ฅด๋Š” ๋ฐฉ๋ฒ•์€ ๋ฌด์—‡์ธ์ง€ ์•Œ์•„๋ณด์ž.

๊ฐ€์žฅ ๋จผ์ €๋Š” ์ฒด์˜จ ๋ฐ์ดํ„ฐ๋ฅผ ์ •๋ ฌ์‹œํ‚จ๋‹ค. ๊ทธ๋Ÿผ ์ฒด์˜จ์ด ๋‚ฎ์€ ๊ฑฐ๋ถ€ํ„ฐ ๋†’์€ ์ˆœ์„œ๋Œ€๋กœ ๋ฐ์ดํ„ฐ๊ฐ€ ์ •๋ ฌ๋œ๋‹ค. ๊ทธ ๋‹ค์Œ์—๋Š” ์—ฐ์†๋œ ์ฒด์˜จ ๋ฐ์ดํ„ฐ๋ผ๋ฆฌ ํ‰๊ท ์„ ๊ณ„์‚ฐํ•œ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ๊ณ„์‚ฐ๋œ ์ด ํ‰๊ท  ์ฒด์˜จ๋“ค์„ ์ด์šฉํ•ด์„œ ์งˆ๋ฌธ๋“ค์„ ํ•˜๋‚˜์”ฉ ๋งŒ๋“ค์–ด๋ณธ๋‹ค.

๊ทธ ํ›„ ์ด ์งˆ๋ฌธ๋“ค์— ๋Œ€ํ•ด์„œ ์ง€๋‹ˆ ๋ถˆ์ˆœ๋„๋ฅผ ๊ณ„์‚ฐํ•œ๋‹ค. ๊ทธ๋Ÿฌ๋‹ˆ๊นŒ ๊ทธ ํ‰๊ท  ์ฒด์˜จ์„ ๊ธฐ์ค€์œผ๋กœ ์‚ผ์•˜์„ ๋•Œ ๋ฐ์ดํ„ฐ๊ฐ€ ์–ผ๋งˆ๋‚˜ ์ž˜ ๋ถ„๋ฅ˜๋๋Š”์ง€๋ฅผ ์ „๋ถ€๋‹ค ๊ณ„์‚ฐํ•ด ์ฃผ๋Š” ๊ฒƒ์ด๋‹ค.

๊ทธ๋ ‡๊ฒŒ ํ•ด์„œ ์ด ์ค‘์—์„œ ๊ฐ€์žฅ ์ง€๋‹ˆ ๋ถˆ์ˆœ๋„๊ฐ€ ๋‚ฎ์€ ์งˆ๋ฌธ์ด ์žˆ์„ ํ…๋ฐ, ์˜ˆ๋ฅผ ๋“ค์–ด์„œ ์ฒด์˜จ์ด 37.5๋ฅผ ๊ธฐ์ค€์œผ๋กœ ๋‚˜๋ˆด์„ ๋•Œ๊ฐ€ ๊ฐ€์žฅ ์ง€๋‹ˆ ๋ถˆ์ˆœ๋„๊ฐ€ ๋‚ฎ๋‹ค๊ณ  ํ•˜์ž. ๊ทธ๋Ÿผ ์ฒด์˜จ ์†์„ฑ ๊ด€๋ จ ์งˆ๋ฌธ ๋…ธ๋“œ๋ฅผ ๋งŒ๋“ค ๋•Œ ๋Œ€ํ‘œ๋กœ โ€œ์ฒด์˜จ์ด 37.5๊ฐ€ ๋„˜๋‚˜์š”?โ€๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด ๋œ๋‹ค.

๊ทธ๋Ÿผ ์ด์ œ ๋…ธ๋“œ๋ฅผ ์„ ํƒํ•  ๋•Œ๋Š” โ€œ37.5๊ฐ€ ๋„˜๋‚˜์š”?โ€, โ€œ๋ชธ์‚ด์ด ์žˆ๋‚˜์š”?โ€, โ€œ๊ธฐ์นจ์ด ์žˆ๋‚˜์š”?โ€ ์ด ์„ธ ์งˆ๋ฌธ ๋…ธ๋“œ๋“ค๊ณผ ๋ถ„๋ฅ˜ ๋…ธ๋“œ๋“ค ์ค‘ ๊ฐ€์žฅ ์ง€๋‹ˆ ๋ถˆ์ˆœ๋„๊ฐ€ ๋‚ฎ์€ ๊ฑฐ๋ฅผ ์„ ํƒํ•˜๋ฉด ๋œ๋‹ค.

์ฃผ์˜ํ•  ์ ์€ ๋‹ค์Œ ๋…ธ๋“œ๋ฅผ ๋งŒ๋“ค ๋•Œ ๋งŒ๋“ค์–ด ๋†“์€ โ€œ37.5๊ฐ€ ๋„˜๋‚˜์š”?โ€๋ผ๋Š” ๋Œ€ํ‘œ ์งˆ๋ฌธ ๋…ธ๋“œ๋ฅผ ์žฌ์‚ฌ์šฉํ•˜๋Š” ๊ฑด ์•„๋‹ˆ๋‹ค. ๋งค๋ฒˆ ๋…ธ๋“œ๋ฅผ ๋งŒ๋“ค ๋•Œ๋งˆ๋‹ค ์œ„์—์„œ ํ–ˆ๋˜ ๊ฑฐ์ฒ˜๋Ÿผ ํ•ด๋‹น ๋…ธ๋“œ๊นŒ์ง€ ์˜ค๋Š” ํ•™์Šต ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด์„œ ๊ฐ€์žฅ ์ข‹์€ ์ฒด์˜จ ์งˆ๋ฌธ์„ ๋˜๋‹ค์‹œ ์ฐพ์•„๋‚ด์•ผ ํ•œ๋‹ค.

๐Ÿ“ ์†์„ฑ ์ค‘์š”๋„

๊ฒฐ์ • ํŠธ๋ฆฌ์˜ ์žฅ์ ์€ ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.

  • ์ง๊ด€์ ์ด๋‹ค.
  • ํ•ด์„ํ•˜๊ธฐ ์‰ฝ๋‹ค.

์—ฌ๊ธฐ์„œ ํ•ด์„ํ•œ๋‹ค๋Š” ๊ฒƒ์€ ๋จธ์‹ ๋Ÿฌ๋‹์—์„œ ์˜ˆ์ธก์„ ํ•˜๋Š” ๋ฐ ์žˆ์–ด์„œ ์–ด๋–ค ์†์„ฑ๋“ค์ด ์ข€ ๋” ์ค‘์š”ํ•˜๊ฒŒ ์‚ฌ์šฉ๋๊ณ , ์–ด๋–ค ๊ฒƒ๋“ค์ด ์ข€ ๋œ ์ค‘์š”ํ•˜๊ฒŒ ์‚ฌ์šฉ๋๋Š”์ง€... ์ด๋Ÿฐ ๊ฑธ ์•Œ์•„๋‚ธ๋‹ค๋Š” ๊ฒƒ์ด๋‹ค.

๊ทธ๋Ÿผ ๊ทธ ์†์„ฑ๋“ค์˜ ์ค‘์š”๋„๋ฅผ ๊ณ„์‚ฐํ•˜๋Š” ๋ฐฉ๋ฒ•์— ๋Œ€ํ•ด์„œ ์•Œ์•„๋ณด์ž.

์†์„ฑ๋“ค์˜ ์ค‘์š”๋„๋ฅผ ๊ณ„์‚ฐํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ์šฐ์„  ๊ฐ ๋…ธ๋“œ ํ•˜๋‚˜ํ•˜๋‚˜์˜ ์ค‘์š”๋„๋ฅผ ๊ณ„์‚ฐํ•ด์•ผ ํ•œ๋‹ค. ๋…ธ๋“œ ์ค‘์š”๋„ (Node Importance) NINI๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์ด ๊ณ„์‚ฐํ•œ๋‹ค.

NI=nmGIโˆ’nleftmGIleftโˆ’nrightmGIrightNI = \frac{n}{m}GI - \frac{n_{left}}{m}GI_{left} - \frac{n_{right}}{m}GI_{right}

nn์€ ์ค‘์š”๋„๋ฅผ ๊ณ„์‚ฐํ•˜๋ ค๋Š” ๋…ธ๋“œ๊นŒ์ง€ ์˜ค๋Š” ํ•™์Šต ๋ฐ์ดํ„ฐ์˜ ์ˆ˜์ด๊ณ , GIGI๋Š” ์ด ๋…ธ๋“œ๊นŒ์ง€ ์˜ค๋Š” ๋ฐ์ดํ„ฐ ์…‹์˜ ๋ถˆ์ˆœ๋„, ๊ทธ๋ฆฌ๊ณ  mm์€ ์ „์ฒด ํ•™์Šต ๋ฐ์ดํ„ฐ์˜ ์ˆ˜์ด๋‹ค.
๋จผ์ € ๊ณ„์‚ฐํ•˜๋ ค๋Š” ๋…ธ๋“œ๊นŒ์ง€ ์˜ค๋Š” ํ•™์Šต ๋ฐ์ดํ„ฐ ์ˆ˜ nn์ด๋ž‘ ๋ถˆ์ˆœ๋„ GIGI๋ฅผ ๊ณฑํ•œ ํ›„, ์ด ๋ฐ์ดํ„ฐ ์ˆ˜ mm์œผ๋กœ ๋‚˜๋ˆ ์ค€๋‹ค.
๊ทธ๋ฆฌ๊ณ  ์ค‘์š”๋„๋ฅผ ๊ณ„์‚ฐํ•˜๋ ค๋Š” ๋…ธ๋“œ์˜ ์™ผ์ชฝ ์ž์‹ ๋…ธ๋“œ, ์˜ค๋ฅธ์ชฝ ์ž์‹ ๋…ธ๋“œ์—์„œ๋„ ๋˜‘๊ฐ™์ด ๊ณ„์‚ฐ์„ ํ•œ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ์ค‘์š”๋„๋ฅผ ๊ณ„์‚ฐํ•˜๋ ค๋Š” ๋…ธ๋“œ์˜ ๊ณ„์‚ฐ ๊ฐ’์—์„œ ๋‚˜๋จธ์ง€ ๋‘ ๋…ธ๋“œ์˜ ๊ณ„์‚ฐ ๊ฐ’์„ ๋นผ๋ฉด ๋œ๋‹ค.

์˜ˆ์‹œ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.
์ „์ฒด์— ํ•™์Šต ๋ฐ์ดํ„ฐ๋Š” 90๊ฐœ๊ณ , root ๋…ธ๋“œ์˜ ์ค‘์š”๋„๋ฅผ ๊ณ„์‚ฐํ•œ๋‹ค๊ณ  ํ•ด๋ณด์ž.

์ด๊ฑธ ์ด์šฉํ•ด์„œ root ๋…ธ๋“œ(์ฃผํ™ฉ์ƒ‰ ๋ฐ•์Šค)์˜ ์ค‘์š”๋„๋ฅผ ๊ณ„์‚ฐํ•ด ๋ณด๋ฉด ์•„๋ž˜์™€ ๊ฐ™๋‹ค.

NIroot=9090โˆ—0.333โˆ’6090โˆ—0.270โˆ’3090โˆ—0.222=0.079NI_{root} = \frac{90}{90} * 0.333 - \frac{60}{90} * 0.270 - \frac{30}{90} * 0.222 = 0.079

๋…ธ๋“œ ์ค‘์š”๋„๋Š” ์ •ํ™•ํžˆ ๋ฌด์—‡์„ ์ˆ˜์น˜ํ™” ํ•œ ๊ฒƒ์ผ๊นŒ? ๋…ธ๋“œ ์ค‘์š”๋„๋ฅผ ๊ณ„์‚ฐํ•˜๋Š” ์‹์„ ๋‹ค์‹œ ๋ณด๋ฉด ์•„๋ž˜์™€ ๊ฐ™์•˜๋‹ค.

NI=nmGIโˆ’nleftmGIleftโˆ’nrightmGIrightNI = \frac{n}{m}GI - \frac{n_{left}}{m}GI_{left} - \frac{n_{right}}{m}GI_{right}

์ค‘์š”๋„๋ฅผ ๊ณ„์‚ฐํ•˜๋ ค๋Š” ๋…ธ๋“œ์˜ ๋ถˆ์ˆœ๋„์—์„œ ๊ทธ ๋…ธ๋“œ ์•„๋ž˜ ๋…ธ๋“œ๋“ค(์™ผ์ชฝ, ์˜ค๋ฅธ์ชฝ)์˜ ๋ถˆ์ˆœ๋„๋ฅผ ๋บ€ ๊ฑฐ๊ณ , ๊ฐ ํ•ญ์— ํ•ด๋‹น ๋…ธ๋“œ๋“ค๊นŒ์ง€ ๊ฐ€๋Š” ๋ฐ์ดํ„ฐ์˜ ๋น„์œจ์„ ๋งž์ถฐ์ค€ ๊ฑฐ๋‹ค.

์ƒ๊ฐํ•ด๋ณด๋ฉด ์ด๊ฑด ํ•œ ๋…ธ๋“œ์—์„œ ๋ฐ์ดํ„ฐ๋ฅผ ๋‘ ๊ฐœ๋กœ ๋‚˜๋ˆด์„ ๋•Œ, ๋ฐ์ดํ„ฐ ์ˆ˜์— ๋น„๋ก€ํ•ด์„œ ๋ถˆ์ˆœ๋„๊ฐ€ ์–ผ๋งˆ๋‚˜ ์ค„์–ด๋“ค์—ˆ๋Š”์ง€๋ฅผ ๊ณ„์‚ฐํ•˜๋Š” ๊ฒƒ์ด๋‹ค.

์ฆ‰, ํŠน์ • ๋…ธ๋“œ๊ฐ€ ์–ผ๋งˆ๋‚˜ ์ค‘์š”ํ•œ ๋…ธ๋“œ์ธ์ง€๋ฅผ ํŒ๋‹จํ•  ๋•Œ, ์ด ๋…ธ๋“œ ์ „ํ›„๋กœ ๋ถˆ์ˆœ๋„๊ฐ€ ์–ผ๋งˆ๋‚˜ ๋‚ฎ์•„์กŒ๋Š”์ง€๋ฅผ ๋ณด๋Š” ๊ฒƒ์ด๋‹ค. ๋”ฐ๋ผ์„œ NINI๋Š” ๋†’์„ ์ˆ˜๋ก ์ข‹๋‹ค.

๋ถˆ์ˆœ๋„๊ฐ€ ๋‚ฎ์•„์งˆ์ˆ˜๋ก ๋‚˜๋ˆ ์ง€๋Š” ๋ฐ์ดํ„ฐ ์…‹๋“ค์—์„œ ์ ์  ๋…๊ฐ ๋˜๋Š” ์ผ๋ฐ˜ ๊ฐ๊ธฐ ๋ฐ์ดํ„ฐ ์ค‘ ํ•˜๋‚˜์˜ ๋น„์œจ์ด ๋งŽ์•„์ง€๋Š”๋ฐ, ์ด๋Š” ๋‚˜๋ˆ ์ง€๋Š” ๋ฐ์ดํ„ฐ ์…‹๋“ค์— ๋Œ€ํ•ด์„œ ์ ์  ๋” ์•Œ์•„๊ฐ„๋‹ค, ๋˜๋Š” "๋” ๋งŽ์€ ์ •๋ณด๋ฅผ ์–ป๋Š”๋‹ค"๋ผ๊ณ  ํ•ด์„œ ์ด ์ˆ˜์น˜๋ฅผ ์ •๋ณด ์ฆ๊ฐ€๋Ÿ‰, ์˜์–ด๋กœ๋Š” Information Gain (IG)๋ผ๊ณ ๋„ ๋ถ€๋ฅธ๋‹ค. (๊ฐœ๋…์  ์œ ์‚ฌ)

์ •๋ฆฌํ•˜๋ฉด

  • NINI = ๋ถ„ํ•  ์ „ ์ง€๋‹ˆ - ๋ถ„ํ•  ํ›„ ๊ฐ€์ค‘ ํ‰๊ท  ์ง€๋‹ˆ
  • IGIG = ๋ถ„ํ•  ์ „ ์—”ํŠธ๋กœํ”ผ - ๋ถ„ํ•  ํ›„ ๊ฐ€์ค‘ ํ‰๊ท  ์—”ํŠธ๋กœํ”ผ

์ด์ œ ๋…ธ๋“œ ์ค‘์š”๋„์— ๋Œ€ํ•ด์„œ ๋ฐฐ์› ์œผ๋‹ˆ ๊ฒฐ์ • ํŠธ๋ฆฌ์˜ ๋ชจ๋“  ๋…ธ๋“œ๋“ค์— ๋Œ€ํ•ด์„œ ๋…ธ๋“œ ์ค‘์š”๋„๋ฅผ ๊ณ„์‚ฐํ•œ๋‹ค.

์ด๊ฑธ ์จ์„œ ํŠน์ • ์†์„ฑ์ด ์–ผ๋งˆ๋‚˜ ์ค‘์š”ํ•œ์ง€๋ฅผ ๊ณ„์‚ฐํ•  ์ˆ˜ ์žˆ๋‹ค. ๊ณ„์‚ฐํ•˜๋Š” ๋ฐฉ๋ฒ•์€ ์•„๋ž˜์™€ ๊ฐ™๋‹ค.

๊ณ ์—ด์ด ์–ผ๋งˆ๋‚˜ ์ค‘์š”ํ•œ์ง€ ์•Œ๊ณ  ์‹ถ๋‹ค๊ณ  ํ•˜์ž. ๊ณ ์—ด ์งˆ๋ฌธ์„ ๊ฐ–๋Š” ๋ชจ๋“  ๋…ธ๋“œ์˜ ์ค‘์š”๋„๋ฅผ ๋”ํ•˜๊ณ  ํŠธ๋ฆฌ ์•ˆ์— ๋ชจ๋“  ๋…ธ๋“œ์˜ ์ค‘์š”๋„์˜ ํ•ฉ์œผ๋กœ ๋‚˜๋ˆ ์ค€๋‹ค.

๊ธฐ์นจ์ด ์–ผ๋งŒํผ ์ค‘์š”ํ•œ์ง€ ์•Œ๊ณ  ์‹ถ์œผ๋ฉด, ๊ธฐ์นจ ์งˆ๋ฌธ์„ ๊ฐ–๋Š” ๋ชจ๋“  ๋…ธ๋“œ์˜ ์ค‘์š”๋„๋ฅผ ๋”ํ•˜๊ณ  ํŠธ๋ฆฌ ์•ˆ์— ๋ชจ๋“  ๋…ธ๋“œ์˜ ์ค‘์š”๋„ ํ•ฉ์œผ๋กœ ๋‚˜๋ˆ ์ค€๋‹ค.

๋ชธ์‚ด์ด ์–ผ๋งˆ๋‚˜ ์ค‘์š”ํ•œ์ง€ ์•Œ๊ณ  ์‹ถ์œผ๋ฉด ๋ชธ์‚ด ๋…ธ๋“œ๋“ค์˜ ์ค‘์š”๋„๋ฅผ ๋”ํ•ด์„œ ๋ชจ๋“  ๋…ธ๋“œ์˜ ์ค‘์š”๋„ ํ•ฉ์œผ๋กœ ๋‚˜๋ˆ„๋ฉด ๋œ๋‹ค.

์‰ฝ๊ฒŒ ์ƒ๊ฐํ•˜๋ฉด, ๋ชจ๋“  ๋…ธ๋“œ๊ฐ€ ๋ฐ์ดํ„ฐ๋ฅผ ์–‘ ๊ฐˆ๋ž˜๋กœ ๋‚˜๋ˆ„๋ฉด์„œ ๋‚˜๋ˆ„๋Š” ๋ฐ์ดํ„ฐ ์…‹๋“ค์˜ ์ง€๋‹ˆ ๋ถˆ์ˆœ๋„๋ฅผ ๋‚ฎ์ถ”๋Š”๋ฐ, ์ „์ฒด์ ์œผ๋กœ ๋‚ฎ์ถฐ์ง„ ๋ถˆ์ˆœ๋„(๋ชจ๋“  ๋…ธ๋“œ ์ค‘์š”๋„ ํ•ฉ)์—์„œ ํŠน์ • ์†์„ฑ ํ•˜๋‚˜(~์งˆ๋ฌธ ๋…ธ๋“œ ์ค‘์š”๋„ ํ•ฉ)๊ฐ€ ๋‚ฎ์ถ˜ ๋ถˆ์ˆœ๋„๊ฐ€ ์–ผ๋งˆ๋‚˜ ๋˜๋Š”์ง€๋ฅผ ๊ณ„์‚ฐํ•œ ๊ฒƒ์ด๋‹ค.

ํŠน์ • ์†์„ฑ์„ ์งˆ๋ฌธ์œผ๋กœ ๊ฐ–๋Š” ๋…ธ๋“œ๋“ค์˜ ์ค‘์š”๋„๋“ค์„ ํ‰๊ท ๋‚ธ ๊ฑฐ๋ž‘ ๋น„์Šทํ•œ๋ฐ, ๊ทธ๋ ‡๊ธฐ ๋•Œ๋ฌธ์— ์ด๋ ‡๊ฒŒ ์ตœ์ข…์ ์œผ๋กœ ๊ตฌํ•œ ๊ฐ’์„ ์†์„ฑ์˜ ํ‰๊ท  ์ง€๋‹ˆ ๊ฐ์†Œ (Mean Gini decrease)๋ผ๊ณ  ๋ถ€๋ฅด๊ธฐ๋„ ํ•œ๋‹ค.

๊ฐ ์†์„ฑ์˜ ํ‰๊ท  ์ง€๋‹ˆ ๊ฐ์†Œ๋ฅผ ์ด์šฉํ•˜๋ฉด, ํŠน์ • ์†์„ฑ์ด ๊ฒฐ์ • ํŠธ๋ฆฌ ์•ˆ์—์„œ ํ‰๊ท ์ ์œผ๋กœ ์–ผ๋งˆ๋‚˜ ๋ถˆ์ˆœ๋„๋ฅผ ๋‚ฎ์ท„๋Š”์ง€๋ฅผ ๊ณ„์‚ฐํ•  ์ˆ˜ ์žˆ๊ณ , ์ด๊ฒŒ ์žˆ์œผ๋ฉด ๊ฒฐ์ • ํŠธ๋ฆฌ ์•ˆ์—์„œ ๊ทธ ์†์„ฑ์ด ์–ผ๋งˆ๋‚˜ ์ค‘์š”ํ•œ์ง€๋ฅผ ํŒ๋‹จํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒƒ์ด๋‹ค.

๊ฒฐ์ • ํŠธ๋ฆฌ ์‹ค์Šต ์ฝ”๋“œ๋Š” ์•„๋ž˜์™€ ๊ฐ™๋‹ค.

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd

# ๋ฐ์ดํ„ฐ ์ค€๋น„
iris_data = load_iris()

X =pd.DataFrame(iris_data.data, columns=iris_data.feature_names)
y = pd.DataFrame(iris_data.target, columns=['Class'])

# ๊ฒฐ์ • ํŠธ๋ฆฌ ์‚ฌ์šฉ
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=5)

model = DecisionTreeClassifier(max_depth=4) # ๊ฒฐ์ • ํŠธ๋ฆฌ์˜ ์ตœ๋Œ€ ๊นŠ์ด ์„ค์ •
model.fit(X_train, y_train)

model.predict(X_test)
model.score(X_test, y_test) # ์„ฑ๋Šฅ ํ‰๊ฐ€ -> ๊ฒฐ๊ณผ: 0.9

# ์†์„ฑ ์ค‘์š”๋„ ๋ณด๊ธฐ
importances = model.feature_importances_
indices_sorted = np.argsort(importances)

plt.figure()
plt.title("Feature Importances")
plt.bar(range(len(importances)), importances[indices_sorted])
plt.xticks(range(len(importances)), X.columns[indices_sorted], rotation=90)
plt.show()

๊ฒฐ๊ณผ:


์ถœ์ฒ˜: ์ฝ”๋“œ์ž‡

0๊ฐœ์˜ ๋Œ“๊ธ€