๐จโ๐ซ ๋ณธ ๋ฆฌ๋ทฐ๋ cs231n-2017 ๊ฐ์๋ฅผ ๋ฐํ์ผ๋ก ์งํํ์ต๋๋ค.
๐ Image Classification: Computer Vision์ Core task์ด๋ค.!!!
โก ์ ์ฌ์ง์ ๋ณด๋ฉด ์ฐ๋ฆฌ๋ "๊ณ ์์ด"๋ผ๋ ๊ฑธ ์ ์ ์๋ค. ํ์ง๋ง ์ปดํจํฐ๋ ์ธ์ํ์ง ๋ชปํ๋ค.
โก ์ ์ฌ์ง์ ์ปดํจํฐ๊ฐ ๋ณด๋ ๊ณ ์์ด ์ฌ์ง์ ์ผ๋ถ์ด๋ค.
๐จโ๐ซ ์ข์ Image Classification์ ํ๊ธฐ ์ํด์ ์์ ๊ฐ์ ์กฐ๊ฑด๋ค์ด ๋ง์กฑํด์ผํ๋ค. ๊ฐ์์์๋ 'robust' ํด์ผํ๋ค๊ณ ์ธ๊ธํ๋ค.
** Robust๋ ํด์ํ์๋ง ์ฌ์ ์ ์ผ๋ก "๊ฐ๊ฑดํ" ์ด๋ผ๋ ์๋ฏธ๋ฅผ ๊ฐ์ง๋ค. ์กฐ๊ธ ๋ ๋จธ์ ๋ฌ๋ ๊ด์ ์ผ๋ก ์ด์ผ๊ธฐํ๋ฉด outlier์ ๋ ๋ฏผ๊ฐํ๋ค๋ ๋ป์ด๋ค. (Ex. t-๋ถํฌ๋ ์ ๊ท๋ถํฌ๋ณด๋ค robustํ๋ค. ๋ ๋ถํฌ์ ๊ทธ๋ํ๋ฅผ ๋ณด๋ฉด t-๋ถํฌ๊ฐ ์ ๊ท๋ถํฌ๋ณด๋ค ๋ ๋๊บผ์ด ๊ผฌ๋ฆฌ๋ฅผ ๋ณผ ์ ์๋ค.)
๐ ์ง๊ด์ ์ธ ์๊ณ ๋ฆฌ์ฆ์ผ๋ก๋ ๊ตฌํํ๊ธฐ์๋ ๋๋ฌด๋ ์ด๋ ค์ด ๊ณผ์ ์ด๋ค. ์์ ์ฌ์ง๊ณผ ๊ฐ์ง edges์ corners๋ฅผ ์ฌ์ฉํด ๊ตฌ๋ถํ ์ ์์ง๋ง, ์์ ๋ฐฉ์์ ์์ ์กฐ๊ฑด๋ค์ ๋ํด robust ํ์ง ๋ชปํ๋ค.
(1). Collect a dataset of images and labels
(2). Use Machine Learning to train a classifier
(3). Evalute the classifier on new images
๐ ์์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด, Data-Driven Appoach ๋ฐฉ๋ฒ์ ์ฌ์ฉํ๋ค. ์์ฝํ๋ฉด ๋ฐ์ดํฐ ์์ง -> ๋ชจ๋ธ ํ์ต -> ์๋ก์ด ์ด๋ฏธ์ง๋ก test๋ฅผ ํ๋ค. ์ด๋ค ์ง๊ด์ ์ธ ์๊ณ ๋ฆฌ์ฆ์ ์ฐพ๋ ๊ฒ์ด ์๋ ์ฃผ์ด์ง ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ ์๊ณ ๋ฆฌ์ฆ์ ๋ง๋๋ ๋ฐฉ๋ฒ์ด๋ค.
โ ๋งค์ฐ ๊ฐ๋จํ classification์ ๋ชจ๋ธ์ด๋ฉฐ, ์ผ๋ฐ์ ์ผ๋ก ๊ฑฐ๋ฆฌ๋ฅผ ๊ณ์ฐํด classification์ ํ๋ ๋ชจ๋ธ์ด๋ค.
(1) L1 distance: I1, I2์ ์ฐจ๋ฅผ ์ ๋๊ฐํ ํ sumation ํ๋ ๋ฐฉ๋ฒ์ด๋ค.


๐ ๋ํ Curse of dimensionalilty(์ฐจ์์ ์ ์ฃผ)๋ผ๋ ๋ฌธ์ ๊ฐ ์๋ค. ์ฐจ์(=๋ณ์)์ด ์ปค์ง์๋ก , ๊ณ์ฐ๋ฒ์ด ์ง์์ ์ผ๋ก ์ปค์ง๋ ํ์์ด๋ค. ๊ณ ์ฐจ์์ด ๋ ์๋ก ๋ฐ์ดํฐ ์ฌ์ด์ ๊ฑฐ๋ฆฌ๋ฅผ ๋ฉ์ด์ง๊ณ , ๋น ๊ณต๊ฐ์ด ์๊ธด๋ค. ์๋ ์ฌ์ง๊ณผ ๊ฐ์ด 1์ฐจ์์ด ์ฆ๊ฐํ ์๋ก ์ง์์ ์ผ๋ก ์ฆ๊ฐํ๋ ๊ฒ์ ๋ณผ ์ ์๋ค.

๐ Hyperparameter์ ๋ฒ์ญํ๋ฉด ์ด๊ฐ๋งค๋ณ์๋ผ๊ณ ํ๋ค. Hyperparameter์ ๋ชจ๋ธ์ ํ์ต์ํค์ํด ์์์ ์ผ๋ก ์ง์ ํ๋ ๋ณ์๋ผ๊ณ ํ ์ ์๋ค. K-Nearest Neigbor์์ K(=1,3,5..)์ distance(L1,L2)๋ ๋ชจ๋ธ์ ํ์ต์ํค๋ ์ฌ๋์ด ์์์ ์ผ๋ก ์ง์ ํ๋ค. ์ด๋ฌํ ๋ณ์๋ค์ Hyperparameter๋ผ๊ณ ํ๋ค. ์ต์ ์ Hyperparameter๋ ์ ํด์ ธ ์์ง ์์ผ๋ฉฐ problem-dependentํ๋ค๊ณ ํ๋ค.
๐ ์ผ๋ฐ์ ์ผ๋ก Dataset์ train-validation-test๋ก ๋ถ๋ฆฌํ๋ค. ์ฝ๊ฒ train์ ํ์ต์ํค๊ธฐ ์ํด test๋ ํ ์คํธํ๊ธฐ ์ํด ์ฌ์ฉ๋๋ค. ๊ทธ๋ผ validation์ ๋ฌด์์ผ๊น?



๐ Parametic classifier๋ ๊ฐ๋จํ๊ฒ train data์ ์ ๋ณด๊ฐ ๊ฐ์ค์น W๋ก ์์ฝ๋์ด ์๋ ๊ฒ์ด๋ค.
๐ Linear Classification์ ์์ ์ฌ์ง๊ณผ ๊ฐ์ด ํจ์ F๋ฅผ ํตํด ํน์ ๊ฒฐ๊ณผ๋ฅผ ๋ํ๋ด๋ ๊ฒ์ด๋ค. ์ฌ๊ธฐ์ ์ด์ ๊ณผ ๋ค๋ฅธ์ ์ W์ธ๋ฐ ์ผ๋ฐ์ ์ผ๋ก Parameter or weights๋ผ๊ณ ๋ถ๋ฆฐ๋ค. ๊ธฐ์กด K-NN์์๋ ๋ฐ๋ก Parameter๊ฐ ์กด์ฌํ์ง ์์๋ค. Linear Classification์์ Parameter์ ์ญํ์ ๊ฒฐ๊ณผ์ ๋ง์ ์ํฅ์ด ๋ฏธ์น๊ธฐ ๋๋ฌธ์ ์ข์ ๊ฒฐ๊ณผ๋ฅผ ์ํด์ , ์ข์ ํ๋ผ๋ฏธํฐ(?)๊ฐ ํ์ํ๋ค.
๐ ์์ ์ฌ์ง์์ ํจ์ f(x,W)๊ฐ ๊ธฐ๋ณธ์ ์ธ Linear Classification์ ์๊ณ ๋ฆฌ์ฆ๋ผ๊ณ ๋ณด๋ฉด ๋๋ค. x๋ input, W๋ Parameter or weights, b๋ bias๋ผ๊ณ ์ผ๋ฐ์ ์ผ๋ก ์ง์นญํ๋ค. Linear Classification์ ์ฌ์ฉํ ๋(?) ์ค์ํ ์ ์ dimension์ด๋ค. ์ผ๋ฐ์ ์ผ๋ก ํ๋ ฌ์ฐ์ฐ์ dimension์ด ์ผ์นํ์ง ์์ผ๋ฉด ์ฐ์ฐ์ด ๋ถ๊ฐ๋ฅํ๊ธฐ์ ํญ์ ์ ๋ ํด์ผํ๋ค.

