๐๊ฐ๋
์ฃผ์ด์ง ๋ฐ์ดํฐ๋ฅผ 2๊ฐ ์ด์์ ํด๋์ค๋ก ๋ถ๋ฅํ๋ ๊ฒ์ด๋ค. feature x๊ฐ ์ฃผ์ด์ก์ ๋, ํด๋์ค y๋ฅผ ๊ฒฐ์ ํ๋ ํจ์๋ฅผ ์ฌ์ฉํ๋ค.
feature x๋ ์ฌ๋ฌ๊ฐ์ผ ์ ์๋ค.
K-Nearest Neighbor, Decision Tree, Neural Network ๋ฑ์ ์ ์ฉํ์ฌ ๊ตฌํ ์ ์๋ค.
๐Nonparametric methods
Nonparametric methods๋ parameter๊ฐ ์๊ณ ๋ฐ์ดํฐ๋ฅผ ๊ทธ๋ฅ ์ ์ฅํ๋ ๋ฐฉ์์ ๋งํ๋ค. ๋ชจ๋ธ์ ์์ฑํ์ง ์๊ณ ๋ฐ์ดํฐ ๊ฐ๊ฐ์ ์ด์ฉํ๋ค. ์ ๋ฐ์ดํฐ๊ฐ ๋ค์ด์ค๋ฉด ๊ทธ์ ๋ฐ๋ผ output์ ์ฐ์ถํ๋ค. ๋ฐ๋ผ์ ๋ฐ์ดํฐ ๊ฐ์๋งํผ์ ์ ์ฅ๊ณต๊ฐ์ด ํ์ํ๋ค. Lazy learning์ด๋ผ๊ณ ๋ ๋ถ๋ฆฐ๋ค.
Parametric methods๋ parameter๊ฐ ์๋ ๋ฐฉ์์ด๋ฉฐ, ๋๋ถ๋ถ์ ๋ชจ๋ธ๋ค์ parametric ๋ฐฉ์์ด๋ค.
๐1-Nearest Neighbor
์๋ก์ด ๋ฐ์ดํฐ(๋ถ๋ฅํ๊ณ ์ ํ๋ ๋ฐ์ดํฐ)๊ฐ ๋ค์ด์์ ๋, ํ๋์ ์ต๊ทผ์ ๋ฐ์ดํฐ๋ฅผ ์ด์ฉํด ์ ๋ฐ์ดํฐ๋ฅผ ์์ธกํ๋ค. ๊ฐ๋จํ ๋งํด ๊ฐ์ฅ ๊ฐ๊น์ด ๊ฒ ํ๋๋ฅผ ์ฐพ์๋ ๊ฒ์ด๋ค. ๊ฐ์ฅ ๊ฐ๊น์ด ๊ฒ์ ์ ํํ๋ ค๋ฉด ๊ฑฐ๋ฆฌ๋ฅผ ๊ณ์ฐํด์ผํ๋๋ฐ, ๊ฑฐ๋ฆฌ ๊ณ์ฐ ๋ฐฉ์์ ์ ํด๋ฆฌ๋ ๊ฑฐ๋ฆฌ ๊ณต์์ ์ฌ์ฉํ๋ค.
๊ฐ์ฅ ๊ฐ๊น์ด ๋ฐ์ดํฐ์ ํด๋์ค๊ฐ ์ ๋ฐ์ดํฐ์ ํด๋์ค๊ฐ ๋ ๊ฒ์ด๋ค.
๐K-Nearest Neighbor
์ฌ๊ธฐ์๋ ๊ฐ์ฅ ๊ฐ๊น์ด K๊ฐ์ ๋ฐ์ดํฐ๋ฅผ ์ด์ฉํด ์ ๋ฐ์ดํฐ๋ฅผ ๋ถ๋ฅํ๋ค. ๊ฑฐ๋ฆฌ๋ฅผ ์ธก์ ํ๋ ๋ฐฉ์์ ๋์ผํ๊ฒ ์ ํด๋ฆฌ๋ ๊ฑฐ๋ฆฌ ๊ณต์์ ์ด์ฉํ๋ค.
Majority vote๋ ๋ค์๊ฒฐ ๋ฐฉ์์ด๋ค. ๊ฐ๊น์ด K๊ฐ์ ๋ฐ์ดํฐ ์ค ๋ค์์ ํด๋์ค๊ฐ ์ ๋ฐ์ดํฐ์ ํด๋์ค๊ฐ ๋๋ค.
Weighted Majority vote๋ ๋ค์๊ฒฐ ๋ฐฉ์์ ๋๊ฐ์ 1ํ๋ฅผ ์ฃผ๋ ๊ฒ์ด ์๋๋ผ, ๊ฐ๊น์ธ์๋ก ์ํฅ๋ ฅ์ ๋์ด๋ ๊ฒ์ด๋ค. ๊ฑฐ๋ฆฌ๊ฐ ๊ฐ๊น์ธ์๋ก ์ํฅ๋ ฅ์ธ weight๋ ์ปค์ ธ์ผ ํ๋ฏ๋ก, weight๋ฅผ ๋ฐ์ํ ๊ณ์ฐ์ ํ ๋ ๊ฑฐ๋ฆฌ์ ์ญ์๋ฅผ ๊ณฑํด์ฃผ๋ฉด ๋๋ค.
์ด๋ K์ ๋ฐ๋ผ ๊ฒฐ๊ณผ๊ฐ ๋ฌ๋ผ์ง ์ ์์ผ๋ฏ๋ก K๋ฅผ ์ ์ ํ ์ ํ๋ ๊ฒ์ด ์ค์ํ๋ค.
KNN์ ๋งค์ฐ ์ง๊ด์ ์ด๊ณ ๊ฐ๋จํ๋ฉฐ, ์ ํ๋๊ฐ ๋๋ค๋ ์ฅ์ ์ด ์๋ค.