๐Ÿ” ๋ฌธ์„œ ๋ถ„๋ฅ˜ : Vector space classification

๊น€์ง€์œคยท2023๋…„ 12์›” 15์ผ
0

์ •๋ณด๊ฒ€์ƒ‰

๋ชฉ๋ก ๋ณด๊ธฐ
8/11

(์‚ฌ์ „์— ํ•„์š”ํ•œ ๊ฒƒ)
training set
๋ฌธ์„œ๋“ค๋งˆ๋‹ค ์–ด๋–ค ํด๋ž˜์Šค์— ์†ํ•˜๋Š”์ง€ ๋ผ๋ฒจ๋ง์„ ํ•ด์ค€๋‹ค.


๐Ÿ” Vector space classification

์ƒˆ๋กœ์šด ๋ฌธ์„œ๊ฐ€ ์–ด๋–ค ํด๋ž˜์Šค(vector space)์— ์†ํ•˜๋Š”์ง€ ๋ถ„๋ฅ˜ํ•˜๋Š” ๊ฒƒ


๊ตฌ๋ถ„์„ ์„ ์ฐพ์•„์•ผํ•œ๋‹ค!




โœ” ๋ฐฉ๋ฒ• 1. Rocchio ์•Œ๊ณ ๋ฆฌ์ฆ˜

  • Relevance feedback์„ ์ด์šฉํ•œ๋‹ค.

  • โ€ป text-classification๊ณผ relavance feedback ์ฐจ์ด

    • text-classification์€ training set์ด ๋จผ์ € ์ฃผ์–ด์ง„๋‹ค.
    • relavance feedback์€ ๊ฒฐ๊ณผ์— ๋Œ€ํ•ด ์‚ฌ์šฉ์ž๊ฐ€ ๋‹ค์‹œ ์ฒดํฌํ•œ๋‹ค.
  • ๊ธฐ๋ณธ ์•„์ด๋””์–ด : ๊ฐ ํด๋ž˜์Šค์˜ centroid๋ฅผ ๊ตฌํ•œ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ์ œ์ผ ๊ฐ€๊นŒ์šด centroid์˜ ํด๋ž˜์Šค๋กœ ๋ถ„๋ฅ˜ํ•œ๋‹ค.

    • centroid : ํด๋ž˜์Šค์˜ ๋ชจ๋“  vector ๊ฐ’์„ ๋”ํ•˜๊ณ  ํด๋ž˜์Šค์˜ ์ „์ฒด ๋ฌธ์„œ ๊ฐฏ์ˆ˜๋กœ ๋‚˜๋ˆˆ๋‹ค.
    • seperator : ์„œ๋กœ ๋‹ค๋ฅธ ํด๋ž˜์Šค์˜ centroid์—์„œ ๊ฐ™์€ ๊ฑฐ๋ฆฌ์ธ ๋ถ€๋ถ„์„ ์„ ์œผ๋กœ ๊ธ‹๊ธฐ
  • โ€ป Rocchio๊ณผ Naive Bayes ์ฐจ์ด

    • Rocchio๋Š” ๊ฑฐ๋ฆฌ ๊ธฐ๋ฐ˜์ด๊ณ , Naive Bayes๋Š” ํ™•๋ฅ  ๊ธฐ๋ฐ˜์ด๋‹ค.
    • Rocchio๋Š” multimodal(๊ตฐ์ง‘์ด ์—ฌ๋Ÿฌ๊ฐœ)์ผ ๋•Œ๋Š” ์ž˜ ์ž‘๋™ํ•˜์ง€ ๋ชปํ•œ๋‹ค.
      • ์ด์œ  : multimodal ์ผ ๊ฒฝ์šฐ, centroid๊ฐ€ ์˜๋ฏธ ์—†๋Š” ๊ณณ์— ์ƒ๊ธฐ๊ธฐ ๋•Œ๋ฌธ์— ๋ฌธ์„œ ๋ถ„๋ฅ˜์˜ ์ •ํ™•๋„๊ฐ€ ๋–จ์–ด์งˆ ์ˆ˜ ์žˆ๋‹ค.




โœ” ๋ฐฉ๋ฒ• 2. kNN ์•Œ๊ณ ๋ฆฌ์ฆ˜ (k nearest neighbors)

  • ๊ฐ€์žฅ ๊ฐ€๊นŒ์šด k๊ฐœ์˜ ์ด์›ƒ์˜ class๋ฅผ ๋ณด๊ณ  classification์„ ๊ฒฐ์ •

  • k๊ฐœ์—์„œ ๊ฐ€์žฅ ๋งŽ์ด ๋‚˜์˜จ class๋กœ ๊ฒฐ์ •ํ•œ๋‹ค.

  • Rocchio์™€ Naive Bayes๋ณด๋‹ค ์ •ํ™•๋„๊ฐ€ ์ข‹๋‹ค. ํ•˜์ง€๋งŒ ๋ถ„๋ฅ˜์‹œ ์‹œ๊ฐ„์ด ์˜ค๋ž˜๊ฑธ๋ ค์„œ ์ž˜ ์•ˆ์“ฐ์ธ๋‹ค.

  • Probabilistic kNN : ํ™•๋ฅ ๋กœ ํ‘œํ˜„

profile
๊พธ์ค€ํ•˜๊ฒŒ ๊ณต๋ถ€ํ•˜๊ณ  ๊ธฐ๋กํ•˜๋Š” ๊ฐœ๋ฐœ์ž

0๊ฐœ์˜ ๋Œ“๊ธ€