๐ฆ๐ฆ
๊ณผ๊ฑฐ์ AI(Traditional AI) : Knowledge Engineering
์ต๊ทผ์ AI(State of the Art) : ๋จธ์ ๋ฌ๋, ๋ฅ๋ฌ๋ ๋ฑ
๋จธ์ ๋ฌ๋์ด ๊ฐ๊ด๋ฐ๋ ์ด์
Linear Regression ์์
์์คํจ์๋ฅผ ์ต์ํํ๋ ์๊ณ ๋ฆฌ์ฆ์ ๋ฐฉ๋ฒ๋ก
1. ํด๋ฆฌ์คํฑ(Heuristic) : ์ ํํ ์๋ฆฌ์ ์ธ ์ต์ ํ ๊ธฐ๋ฒ์ ์ ์ฉํ์ง ์๊ณ ๋๋ต์ ์ธ ์ ๊ทผ์ ํตํด์ ์์คํจ์๊ฐ ์ต์ํ๊ฐ ๋๊ฒ๋ ์ ๋ํจ
๋ชจ๋ธ์ ๋ณต์ก๋๊ฐ ์ฌ๋ผ๊ฐ์๋ก train error๋ ์ค์ง๋ง validation error๋ ๊ฐ์ํ๋ค๊ฐ ์ด๋ ์์ ๋ถํฐ๋ ์์นํจ(overfitting)
model validation
๋ฐฉ๋ฒ 1. train ๋ฐ์ดํฐ์
์ผ๋ก๋ง ๊ฒ์ฆ(bad)
๋ฐฉ๋ฒ 2. train, test๋ก ๋๋ ์ ๊ฒ์ฆ(ํ๋ผ๋ฏธํฐ ํ๋ ์ดํ)
๋ฐฉ๋ฒ 3. train, validation, test๋ก ๋๋ ์ ๊ฒ์ฆ(๊ฐ์ฅ ๊ถ์ฅ)
๋ฐฉ๋ฒ 4. cross-validation : ๋ฐ์ดํฐ์
์ test, train์ผ๋ก ๋๋ ๋ค, train ์์์ ์๋ก ๋ฒ๊ฐ์๊ฐ๋ฉด์ train๊ณผ validation ์งํ
๋ชจ๋ธ์ ์ค์ฐจ : bias + variance
KNN(K-Nearest Neighbors)
K๋ ์์์ ์์
๋ ๊ด์ธก์น์ ๊ฑฐ๋ฆฌ๊ฐ ๊ฐ๊น์ฐ๋ฉด Label๋ ๋น์ทํ๋ค
test ๋ฐ์ดํฐ์ ์ ๊ธฐ์ค์ผ๋ก train ๋ฐ์ดํฐ์ ์ K๊ฐ ์ฃผ๋ณ ๊ด์ธก์น์ class์ ๋ํ majority voting
lazy learning algorithm์ด๋ผ๊ณ ๋ ํจ
๋ฒ์ฃผํ ๋ณ์๋ ๋๋ฏธ๋ณ์๋ก ์ฒ๋ฆฌํด์ ๊ฑฐ๋ฆฌ ๊ณ์ฐ
K๊ฐ KNN์ ํ์ดํผํ๋ผ๋ฏธํฐ๊ฐ ๋จ
๋ค์ค์ ํํ๊ท : ์ค๋ช ๋ณ์ X์ ์ข ์๋ณ์ y๊ฐ์ ๊ด๊ณ๋ฅผ ์ ํ์ผ๋ก ๊ฐ์ , ์ด๋ฅผ ๊ฐ์ฅ ์ ํํํ ์ ์๋ ํ๊ท ๊ณ์ ์ถ์
๋ก์ง์คํฑ ํ๊ท : y๊ฐ ๋ฒ์ฃผํ ๋ณ์์. ์ผ๋ฐ ํ๊ท๋ถ์๊ณผ๋ ๋ค๋ฅด๊ฒ ์ ๊ทผ
y๊ฐ ์ด์ง ๋ณ์์ผ ๋, ํ๋ฅ ๊ฐ์ ์ ํํ๊ท๋ถ์์ ์ข ์๋ณ์๋ก ์ฌ์ฉํ๋ ๊ฒ์ด ํ๋นํ๊ฐ?
๋ก์ง์คํฑ ํ๊ท์ ๋ชฉ์ : ์ด์งํํ์ ์ข ์๋ณ์์ ๋ํด ํ๊ท์ ํํ๋ก ๋ชจ๋ธ์ ์ถ์ ํ๋ ๊ฒ
๐ค์ ํ๊ท์์ธ๊ฐ?
๋ก์ง์คํฑ ํ๊ท์ ๋ํ ์์คํจ์ : cross entropy
๊ทผ์ฌ์ ์ผ๋ก ํํํ ์ ์๋ 2์ฐจ๋คํญ์ ์ ๋ -> ๊ทธ 2์ฐจํจ์์์ ๊ธฐ์ธ๊ธฐ๊ฐ ์ต์ํ๋๋ ์ง์ ์ฐพ๊ธฐ
๐กlearning rate
๊ฒฝ์ฌ ํ๊ฐ๋ฒ ์ต์ ํ ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํ์ฌ ํ๋ จํ๋๋ฐ์ ๋์จ ํ๋ผ๋ฏธํฐ
๋ชจ๋ธ์ weight๊ฐ ์ ๋ฐ์ดํธ ๋ ๋๋ง๋ค ์์ ์ค๋ฅ์ ๋ํ ์๋ต์ผ๋ก ๋ชจ๋ธ์ ์กฐ์ ํ๊ณ ์ ์ดํ๋ฉด์ ๋ชจ๋ธ ํ์ต์ ์ํฅ์ ์ฃผ๋ ํ์ดํผ ํ๋ผ๋ฏธํฐ
Gradient descent algorithm์ ์ฌ์ฉํ ๋ cost ๊ฐ์ ๋ฏธ๋ถํ ๊ฐ ์์ ์ํ๋ผ๋ ๊ฐ์ด ์ค๊ฒ ๋๋๋ฐ ์ด ๊ฐ์ด Learning rate์. Learning rate์ ์ด๋ ์ ๋์ ํฌ๊ธฐ๋ก ๊ธฐ์ธ๊ธฐ๊ฐ ์ค์ด๋๋ ์ง์ ์ผ๋ก ์ด๋ํ๊ฒ ๋๊ฐ๋ฅผ ๋ํ๋ด๋ ์งํ
ํ๋ฅ ์ ๊ฒฝ์ฌ ํ๊ฐ๋ฒ(SGD : Stochastic Gradient Descent) : ๋ฐ์ดํฐ์ ์ ์ผ๋ถ๋ฅผ ์ด์ฉํด ๋ฐฐ์น ๋ฐฉ์์ผ๋ก ๊ธฐ์ธ๊ธฐ๋ฅผ ์ถ์ . ๊ทน๋จ์ ์ผ๋ก ๋ฐ์ดํฐ ํ๋๋ง์ ์ด์ฉํด์ ํ ์๋ ์์
๊ฒฝ์ฌํ๊ฐ๋ฒ(gradient descent) ์๊ณ ๋ฆฌ์ฆ์ย ํ์ต๋ฅ (Learning rate, Learning step)์ผ๋ก ์๋ ค์ง ์ค์นผ๋ผ๋ฅผ ๊ณฑํด์ ๋ค์ ์ ์ ๊ฒฐ์ . ์๋ฅผ ๋ค์ด ๊ฒฝ์ฌ ํฌ๊ธฐ๊ฐ 2.5์ด๊ณ ํ์ต๋ฅ ์ด 0.01์ด๋ฉด ๊ฒฝ์ฌํ๊ฐ๋ฒ ์๊ณ ๋ฆฌ์ฆ์ ์ด์ ์ง์ ์์ 0.025 ๋จ์ด์ง ์ง์ ์์ ๋ค์ ์ง์ ์ ์ ํ.
๐ก๋ชจ๋ฉํ
local minimum์ ๋น ์ ธ๋๊ฐ๊ธฐ ์ํด ์ ์ฉํ๋ ๋ฐฉ๋ฒ๋ก . local minimum์ ์ถ์ ํ ๋์ ๊ด์ฑ์ local minimum์ ๋๋ฌํ์ ๋ ๋ํด์ค์ ๋ ์ข์ local minimum ํน์ global minimum์ ํ์ํ๊ณ ์ ํจ
SVM(Support Vector Machine) : ์ ํ ๋ถ๋ฅ, ๋น์ ํ ๋ถ๋ฅ, ํ๊ท, ์ด์์น ํ์์๋ ์ฌ์ฉํ ์ ์๋ ๋จธ์ ๋ฌ๋ ๋ฐฉ๋ฒ๋ก
๋ฅ๋ฌ๋ ์ด์ ์๋๊น์ง ๋๋ฆฌ ์ฌ์ฉ๋จ
๋ณต์กํ ๋ถ๋ฅ ๋ฌธ์ ๋ฅผ ์ ํด๊ฒฐ, ์๊ฑฐ๋ ์ค๊ฐ ํฌ๊ธฐ๋ฅผ ๊ฐ์ง ๋ฐ์ดํฐ์ ์ ํฉ
๋ ํด๋์ค ์ฌ์ด์์ ๊ฐ์ฅ ๋์ ๋ถ๋ฅ ๊ฒฝ๊ณ์ ์ ์ฐพ์(margin์ด ๊ฐ์ฅ ํฐ ๊ฒ)
์ค์ผ์ผ์ ๋ฏผ๊ฐํ๊ธฐ ๋๋ฌธ์ ๋ณ์๋ค ๊ฐ์ ์ค์ผ์ผ์ ์ ๋ง์ถฐ์ฃผ๋ ๊ฒ์ด ์ค์(sklearn.StandardScaler()
)
๐กsupport vector
๐กHard margin vs soft margin
๐กnonlinear SVM
polynomial kernel
gaussian RBF kernel
๐กSVM regression
์ ํ ํ๊ท์์ ์ค์ฌ์ผ๋ก ํํํ ์ค์ฐจ ํ๊ณ์ ์ ๊ฐ์ . ์ค์ฐจํ๊ณ์ ๋๋น๊ฐ ์ต๋๊ฐ ๋๋ฉด์ ์ค์ฐจ ํ๊ณ์ ์ ๋์ด๊ฐ๋ ๊ด์ธก์น๋ค์ ํ๋ํฐ๋ฅผ ๋ถ์ฌํ๋ ๋ฐฉ์์ผ๋ก ์ ํํ๊ท์ ์ถ์