[ML] Multiclass Classification

YJChoยท2024๋…„ 8์›” 7์ผ

Machine Learning

๋ชฉ๋ก ๋ณด๊ธฐ
4/7

1. ๋‹ค์ค‘ ๋ถ„๋ฅ˜๐Ÿ”ฅ

2๊ฐœ ์ด์ƒ์˜ ํด๋ž˜์Šค๋กœ ๋ถ„๋ฅ˜ํ•˜๋Š” ๊ฒƒ์„ ๋‹ค์ค‘ ๋ถ„๋ฅ˜๋ผ๊ณ  ํ•œ๋‹ค.

Random Forest classifiers์™€ Bayes classifiers = multinomial classifiers์˜ ๊ฒฝ์šฐ, ๋‹ค์ค‘ ๋ถ„๋ฅ˜๊ฐ€ ๊ฐ€๋Šฅํ•˜๋‹ค.

ํ•˜์ง€๋งŒ Support Vector Machine classifiers์™€ Linear classifiers๋Š” ์ด์ง„ ๋ถ„๋ฅ˜์—๋งŒ ํ•œ์ •๋œ๋‹ค.

ํ•˜์ง€๋งŒ ์—ฌ๋Ÿฌ ๊ฐœ์˜ ์ด์ง„ ๋ถ„๋ฅ˜๊ธฐ๋ฅผ ํ†ตํ•ด ๋‹ค์ค‘ ๋ถ„๋ฅ˜ํ•˜๋Š” ๊ฒƒ๋„ ๊ฐ€๋Šฅํ•˜๋‹ค.

1) OvA ์ „๋žต

One-versus-all
OvR ๋ฐฉ์‹ (One-versus-Rest)์ด๋ผ๊ณ ๋„ ๋ถˆ๋ฆฐ๋‹ค.

OvA ์ „๋žต์€ ๊ฐ ํด๋ž˜์Šค๋งˆ๋‹ค ํ•˜๋‚˜์˜ ์ด์ง„ ๋ถ„๋ฅ˜๊ธฐ๋ฅผ ํ›ˆ๋ จ์‹œํ‚จ ํ›„, ๋ถ„๋ฅ˜ํ•  ๋•Œ ๋ชจ๋“  ๋ถ„๋ฅ˜๊ธฐ์˜ ๊ฒฐ์ • ์ ์ˆ˜๋ฅผ ๋น„๊ตํ•˜์—ฌ ๊ฐ€์žฅ ๋†’์€ ์ ์ˆ˜๋ฅผ ๊ฐ€์ง„ ๋ถ„๋ฅ˜๊ธฐ์˜ ํด๋ž˜์Šค๋ฅผ ์„ ํƒํ•˜๋Š” ๋ฐฉ์‹์ด๋‹ค.

์˜ˆ๋ฅผ ๋“ค์–ด 0๋ถ€ํ„ฐ 9๊นŒ์ง€์˜ ์ˆซ์ž๋ฅผ ๋‹ค์ค‘ ๋ถ„๋ฅ˜ํ•˜๊ณ ์ž ํ•  ๋•Œ๋Š” 10๊ฐœ์˜ ์ด์ง„ ๋ถ„๋ฅ˜๊ธฐ๋ฅผ ์ด์šฉํ•˜๋ฉด ๋œ๋‹ค. (0 ๊ฒ€์ถœ๊ธฐ, 1 ๊ฒ€์ถœ๊ธฐ...) ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜ ์‹œ์—” ํ•ด๋‹น ์ด๋ฏธ์ง€์— ๋Œ€ํ•œ ๊ฒฐ์ • ์ ์ˆ˜๋ฅผ ๋ฐ›์•„ ๊ฐ€์žฅ ๋†’์€ ์ ์ˆ˜๋ฅผ ์ถœ๋ ฅํ•˜๋Š” ๋ถ„๋ฅ˜๊ธฐ์˜ ํด๋ž˜์Šค๋ฅผ ์„ ํƒํ•œ๋‹ค.

2) OvO ์ „๋žต

One-versus-one

OvO ์ „๋žต์€ ๋ชจ๋“  ํด๋ž˜์Šค ์Œ๋งˆ๋‹ค ์ด์ง„ ๋ถ„๋ฅ˜๊ธฐ๋ฅผ ํ›ˆ๋ จ์‹œ์ผœ, ์ตœ์ข… ๋ถ„๋ฅ˜ ์‹œ ๊ฐ ๋ถ„๋ฅ˜๊ธฐ ๊ฒฐ๊ณผ๋ฅผ ๋น„๊ตํ•˜์—ฌ ๊ฐ€์žฅ ๋งŽ์ด ๋“ํ‘œํ•œ ํด๋ž˜์Šค๋ฅผ ์„ ํƒํ•˜๋Š” ๋ฐฉ์‹์ด๋‹ค.

N๊ฐœ์˜ ํด๋ž˜์Šค๊ฐ€ ์žˆ๋‹ค๋ฉด Nร—(Nโˆ’1)2\frac{N \times (N-1)}{2}๊ฐœ์˜ ๋ถ„๋ฅ˜๊ธฐ๋ฅผ ํ›ˆ๋ จ์‹œํ‚ค๊ฒŒ ๋œ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด 0๋ถ€ํ„ฐ 9๊นŒ์ง€์˜ ์ˆซ์ž๋ฅผ ๋ถ„๋ฅ˜ํ•˜๊ณ ์ž ํ•  ๋• 45๊ฐœ์˜ ๋ถ„๋ฅ˜๊ธฐ๊ฐ€ ๋งŒ๋“ค์–ด์ง„๋‹ค. ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜ ์‹œ์—” ํ•ด๋‹น ์ด๋ฏธ์ง€๋ฅผ ์ด 45๊ฐœ์˜ ๋ถ„๋ฅ˜๊ธฐ์— ๋ชจ๋‘ ํ†ต๊ณผ์‹œ์ผœ์„œ ๊ฐ€์žฅ ๋งŽ์ด ๋“ํ‘œํ•œ ํด๋ž˜์Šค๋ฅผ ์„ ํƒํ•œ๋‹ค.

3) OvA OvO ์„ ํƒ ์ „๋žต

์ผ๋ถ€ ์•Œ๊ณ ๋ฆฌ์ฆ˜(SVM ๋ถ„๋ฅ˜๊ธฐ)์€ ํ›ˆ๋ จ ์„ธํŠธ์˜ ํฌ๊ธฐ์— ๋”ฐ๋ผ ์„ฑ๋Šฅ์ด ์ €ํ•˜๋œ๋‹ค. ๊ทธ๋ž˜์„œ ์ด๋Ÿฌํ•œ ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ๊ฒฝ์šฐ ์ž‘์€ ํ›ˆ๋ จ ์„ธํŠธ์—์„œ ๋งŽ์€ ๋ถ„๋ฅ˜๊ธฐ๋ฅผ ํ›ˆ๋ จ์‹œํ‚ค๋Š” OvO๊ฐ€ ์„ ํ˜ธ๋œ๋‹ค.

๊ทธ๋Ÿฌ๋‚˜ ๋Œ€๋ถ€๋ถ„์˜ ์ด์ง„ ๋ถ„๋ฅ˜ ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ๊ฒฝ์šฐ OvA๊ฐ€ ์„ ํ˜ธ๋œ๋‹ค.

Scikit-Learn์˜ ์ž๋™ ์ „๋žต ์„ ํƒ

Scikit-Learn์€ ์‚ฌ์šฉ์ž๊ฐ€ ์ด์ง„ ๋ถ„๋ฅ˜ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ๋‹ค์ค‘ ํด๋ž˜์Šค ๋ถ„๋ฅ˜์— ์‚ฌ์šฉํ•˜๋ ค๊ณ  ํ•  ๋•Œ ์ด๋ฅผ ๊ฐ์ง€ํ•˜์—ฌ ์ž๋™์œผ๋กœ OvA ์ „๋žต์„ ์ ์šฉํ•œ๋‹ค. ๋‹ค๋งŒ, SVM ๋ถ„๋ฅ˜๊ธฐ์ธ ๊ฒฝ์šฐ์—๋Š” OvO ์ „๋žต์„ ์‚ฌ์šฉํ•œ๋‹ค.

์žฅ์ 

์œ ์—ฐ์„ฑ: ๊ธฐ๋ณธ์ ์œผ๋กœ ๋ชจ๋“  ์ด์ง„ ๋ถ„๋ฅ˜๊ธฐ๋ฅผ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์œผ๋ฏ€๋กœ, ๋‹ค์–‘ํ•œ ๋ถ„๋ฅ˜ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์‰ฝ๊ฒŒ ํ™•์žฅํ•  ๊ฐ€๋Šฅํ•˜๋‹ค. (๊ทธ๋ ‡๊ฒŒ ๋‚˜์˜จ๊ฒŒ ์œ„์˜ ํ•จ์ˆ˜๋‹ค)

๋‹จ์ˆœํ•จ: ๋‹ค์ค‘ ํด๋ž˜์Šค ๋ฌธ์ œ๋ฅผ ์ด์ง„ ๋ถ„๋ฅ˜ ๋ฌธ์ œ๋กœ ๋ณ€ํ™˜ํ•˜๋ฏ€๋กœ, ๊ตฌํ˜„์ด ์ƒ๋Œ€์ ์œผ๋กœ ๋‹จ์ˆœํ•˜๋‹ค!

๋‹จ์ 

ํšจ์œจ์„ฑ ๋ฌธ์ œ: ํด๋ž˜์Šค๊ฐ€ ๋งŽ์•„์ง€๋ฉด ๊ทธ๋งŒํผ ์ด์ง„ ๋ถ„๋ฅ˜๊ธฐ๋„ ๋งŽ์•„์ง€๊ธฐ์— ๋น„์šฉ ์ธก๋ฉด์—์„œ ํšจ๊ณผ์ ์ด์ง€ ์•Š์„ ์ˆ˜ ์žˆ๋‹ค.

๋ถˆ๊ท ํ˜• ๋ฐ์ดํ„ฐ: ํŠน์ • ํด๋ž˜์Šค๊ฐ€ ๋‹ค๋ฅธ ํด๋ž˜์Šค๋ณด๋‹ค ํ›จ์”ฌ ์ ์€ ๊ฒฝ์šฐ, ํ•ด๋‹น ํด๋ž˜์Šค์™€ ๋‚˜๋จธ์ง€ ํด๋ž˜์Šค๋ฅผ ๋น„๊ตํ•  ๋•Œ ๋ถˆ๊ท ํ˜• ๋ฌธ์ œ๊ฐ€ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ๋‹ค.

profile
ํ˜ธ๋กœ๋ก

0๊ฐœ์˜ ๋Œ“๊ธ€