๐ก ๋ง์ฝ์ training set์ด not linearly separable ํ๋ค๋ฉด?
Hard Margin
: ๋ชจ๋ data๊ฐ ๋ถ๋ฅ๋์ด์ผ ํจ!Soft Margin
: ๋ช ๊ฐ๋ ํ๋ ค๋ ๋๋ค๊ณ ํ์ฉ!C
: hyper parameter๋ก ์ผ๋งํผ ํ๋ ค๋ ๋๋๊ฐ๋ฅผ ์ ์N
: ๋ชจ๋ data์ ๋ํด์ margin์ผ๋ก๋ถํฐ์ ๊ฑฐ๋ฆฌL(w)
๊ฐ ์ต์๊ฐ์ด ๋์ด์ผ ํจ!๐ก ํ์ง๋ง ์๋์ ๊ฐ์ dataset์ ์ด๋ป๊ฒ ํด์ผํ ๊น?
โ ๊ณ ์ฐจ์์ผ๋ก mapping โ
separable
ํด์ง!๐ kernel function
๐ Kernel function
๊ณ ์ฐจ์์์ ๋ด์ ํด์ ์ป์ด์ง๋ ํจ์
๋ด์ = ๋ data ๊ฐ์ similarity
reproducing kernel Hilbert space
์์์ ์ ์ฌ๋
์ ํ๋์์์ ๋์ค๋ kernel์ ๊ฐ๋ ๊ณผ๋ ๋ค๋ฆ
๐ Kernel trick
๐ Kernel example
2์ฐจ์ ๊ณต๊ฐ์ data(vector)
์ค์ ๋ก ๊ณ ์ฐจ์์ ๋ณด๋ด์ง ์์๋ ๊ณ ์ฐจ์์ผ๋ก ๋ณด๋ด ์ ์ฌ๋๋ฅผ ์ป์ ๊ฐ๊ณผ ๋๊ฐ์
โ kernel trick
linear
์๊ณ ๋ฆฌ์ฆ์ kernel function๋ง ๋์
ํ๋ฉด non-linear ๋ฌธ์ ๋ ํ ์ ์์!
๐ ๋ํ์ ์ธ Kernel function
kernel function
์ ์๋ โ๐ก ๊ทธ๋ ๋ค๋ฉด kernel function์ ์ด๋ป๊ฒ ๋ง๋ค๊น?
semi-positive definite symmetric
(mercer's theorem)์ผ๋ก kernel function์์ ์ฆ๋ช
time complexity
๋ถ์
compositive kernel
E.g.)
โ linear kernel + polynomial kernel