(์ฌ์ ์ ํ์ํ ๊ฒ)
training set
๋ฌธ์๋ค๋ง๋ค ์ด๋ค ํด๋์ค์ ์ํ๋์ง ๋ผ๋ฒจ๋ง์ ํด์ค๋ค.
์๋ก์ด ๋ฌธ์๊ฐ ์ด๋ค ํด๋์ค(vector space)์ ์ํ๋์ง ๋ถ๋ฅํ๋ ๊ฒ
๊ตฌ๋ถ์ ์ ์ฐพ์์ผํ๋ค!
Relevance feedback์ ์ด์ฉํ๋ค.
โป text-classification๊ณผ relavance feedback ์ฐจ์ด
๊ธฐ๋ณธ ์์ด๋์ด : ๊ฐ ํด๋์ค์ centroid๋ฅผ ๊ตฌํ๋ค. ๊ทธ๋ฆฌ๊ณ ์ ์ผ ๊ฐ๊น์ด centroid์ ํด๋์ค๋ก ๋ถ๋ฅํ๋ค.
โป Rocchio๊ณผ Naive Bayes ์ฐจ์ด
๊ฐ์ฅ ๊ฐ๊น์ด k๊ฐ์ ์ด์์ class๋ฅผ ๋ณด๊ณ classification์ ๊ฒฐ์
k๊ฐ์์ ๊ฐ์ฅ ๋ง์ด ๋์จ class๋ก ๊ฒฐ์ ํ๋ค.
Rocchio์ Naive Bayes๋ณด๋ค ์ ํ๋๊ฐ ์ข๋ค. ํ์ง๋ง ๋ถ๋ฅ์ ์๊ฐ์ด ์ค๋๊ฑธ๋ ค์ ์ ์์ฐ์ธ๋ค.
Probabilistic kNN : ํ๋ฅ ๋ก ํํ