3์ฃผ์ฐจ ์์์ผ
- CNN ๊ธฐ์ด
MLP๋ ๊ฐ ๋ด๋ฐ๋ค์ด ์ ํ ๋ชจ๋ธ๊ณผ ํ์ฑ ํจ์๋ก ์์ ํ ์ฐ๊ฒฐ๋(fully-connected) ๊ตฌ์กฐ > ๋ชจ๋ธ์ ๊ท๋ชจ๊ฐ ์ปค์ง๋ฉด ๊ฐ์ค์น ํ๋ผ๋ฏธํฐ์ ์๋ ์์ฒญ๋๊ฒ ๋ง์์ง๋ค.
CNN(Convolutional Neural Network) ๋ชจ๋ธ์ ์ฌ์ฉํ๊ฒ ๋๋ฉด ๊ธฐ์กด MLP ๋ชจ๋ธ์ ๊ฐ์ค์น์๋ ๋ค๋ฅธ ๊ณ ์ ๋ ์์ ์ปค๋์ ๊ฐ์ค์น๋ก ์ฌ์ฉํ๋ค. ์
๋ ฅ ๋ฐ์ดํฐ ์์์ ์ปค๋์ ์์ง์ฌ ๊ฐ๋ฉฐ ํฉ์ฑ๊ณฑ (convolution) ์ฐ์ฐ์ ์ํํ๋ค. ํ๋์ ์ปค๋์ ์
๋ ฅ ๋ฐ์ดํฐ ์์์ ์ด๋ํ๋๋ผ๋ ๊ทธ ๊ฐ์ด ๋ฐ๋์ง ์๋๋ค.
์ด๋ฏธ์ง์ convolution์ ์ ์ฉํ๋ฉด ์ฌ์ฉํ๋ ์ปค๋์ ๋ฐ๋ผ ๋ค๋ฅธ ํน์ง์ ์ถ์ถํด ๋ผ ์ ์๋ค. (ํ๋ฆฌ๊ฒ ํ๊ธฐ, ์ธ๊ณฝ์ ์ถ์ถ ๋ฑ) CNN์ ์ฃผ๋ก ์ด๋ฏธ์ง ์ฒ๋ฆฌ์ ์ฌ์ฉํ์ง๋ง ์
๋ ฅ ๋ฐ์ดํฐ๊ฐ ๋ฒกํฐ์ผ ์๋ ์๋ค (1d Convnet).
์
๋ ฅ ๋ฐ์ดํฐ ์๋ฅผ ์ค์น๊ณ ์ง๋๊ฐ๋ ์ปค๋์ ํฌ๊ธฐ์ ๋ฐ๋ผ ์ถ๋ ฅ ๋ฐ์ดํฐ์ ํฌ๊ธฐ๊ฐ ๋ฌ๋ผ์ง๋ค. ์
๋ ฅ์ด H * W
ํฌ๊ธฐ, ์ปค๋์ด K_h * K_w
ํฌ๊ธฐ, ์ถ๋ ฅ์ O_h * O_w
ํฌ๊ธฐ๋ผ๊ณ ํ๋ฉด ์ด๋ค์ ๊ด๊ณ๋ ๋ค์๊ณผ ๊ฐ๋ค.
์ปฌ๋ฌ ์ด๋ฏธ์ง๋ r/g/b
์ ๋ณด๋ง ๊ฐ์ง๊ณ ์๋ ์ฑ๋์ด 3๊ฐ ๋ชจ์ฌ ๋ง๋ค์ด์ง๋๋ฐ, ์ปฌ๋ฌ ์ด๋ฏธ์ง๋ฅผ 2์ฐจ์ CNN์ ์
๋ ฅ์ผ๋ก ์ฌ์ฉํ ๊ฒฝ์ฐ์๋ convolution ์ฐ์ฐ์ ๊ฐ ์ฑ๋๋ง๋ค ์ ์ฉํ๊ฒ ๋๋ค. ์ด ๋ ์ปค๋์ ์ ์ญ์ ์ฑ๋ ์์ ์ผ์นํด์ผ ํ๋ค.
ILSVRC (ImageNet Large-Scale Visual Recognition Challenge) ์์ ์์ํ 5๊ฐ์ CNN ๋ชจ๋ธ ๊ตฌ์กฐ
AlexNet (2011)
์
๋ ฅ๋ฐ์ดํฐ์์ 11x11 ์ปค๋ ์ฌ์ฉํ๋๋ฐ ์ ์ฐจ 5x5> 3x3์ผ๋ก ํฌ๊ธฐ ๊ฐ์, 5 conv๋ ์ด์ด, 3 dense๋ ์ด์ด
key) ํ์ฑํจ์๋ก ReLU ์ฌ์ฉ > ์ด ์์ ์์๋ ๋ค๋ค? ์๊ทธ๋ชจ์ด๋๋ฅผ ์ผ๋๋ฐ ReLU๋ฅผ ์จ์ gradient vanishing ๋ฌธ์ ํด๊ฒฐ๋จ
GPU ์ฌ์ฉ
Data augmentaition ์ฌ์ฉ
Dropout ์ฌ์ฉ
์ง๊ธ์ ๋น์ฐํด ๋ณด์ด์ง๋ง ๋น์์๋ ํ๊ธฐ์ ์ธ ์์ด๋์ด์์. ์ง๊ธ ์ ๋๋ ๋ชจ๋ธ๋ค ๋ณด๋ฉด ๋ค ์ ๋ฐ ํน์ฑ์ด ์์ง? ๋งํ์๋ฉด ๊ธฐ์ค์ ์ก์์ค ๊ฒ
VGGNet (2015)
3x3 ์ปค๋๋ง์ ์ฌ์ฉ, ๋ ์ด์ด ๊น์ด๊ฐ ๊น์ด์ง(VGG16์ 16๋ ์ด์ด, VGG19๋ 19๋ ์ด์ด), fully connected(dense) ๋ ์ด์ด์์๋ 1x1 convolutionํจ
Dropout ์ฌ์ฉ
3x3 ์ปค๋๋ก ๋ ์ด์ด ๋ ๊ฐ ์์ ๋๋ 5x5 ์ปค๋๋ก ๋ ์ด์ด ํ ๊ฐ ์์ ๋ ์ป๋ ํน์ฑ ๋งต์ ํฌ๊ธฐ๋ ๋์ผํ๋ฐ 3x3 ์ปค๋์ ์ฐ๋ฉด ํ๋ผ๋ฏธํฐ ์๊ฐ ๋ ์ค์ด๋ ๋ค.
GoogLeNet (2014)
Inception blocks๋ผ๊ณ convolution ํ๊ธฐ ์ ์ 1x1 conv๋ฅผ ํด์ ํ๋ผ๋ฏธํฐ ์๋ฅผ ์ค์ด๋๋ฐ ์ด๊ฒ ํต์ฌ ์์ด๋์ด
์? >
์ด์ ์ ๊ฐ์ด, ํ ๋ช ์ฉ ์ ๋ ํ์ตํ ๋ด์ฉ์ ๋ฏธ๋ ์ธ๋ฏธ๋ ํ์์ผ๋ก ๋ฐํํ๊ธฐ๋ก ํ๋ค. ์ค์ฐจ ์ญ์ ํ์ ์ด์ผ๊ธฐ๋ฅผ ํ๊ณ ์๊ฐ์ด ์ข ๋จ์์ ์ค๋ ๊ฐ์ ์ค CNN์์ ๋ ์ด์ด ๊น์ด๋ฅผ ๋๋ฆฌ๊ณ ์ปค๋ ํฌ๊ธฐ๋ฅผ ์ค์ด๋ ๋ด์ฉ์ ๋ณต์ตํ๋ค๊ฐ ํ๋ผ๋ฏธํฐ์ ์๋ฅผ ์ค์ด๋ ๊ฒ์ด ์ ํจ๊ณผ์ ์ธ๊ฐ์ ๋ํ ์ด์ผ๊ธฐ๋ฅผ ํ๋ค.
์๋ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ด ๋ ์ด์ด ๊น์ด๋ฅผ ๋๋ฆฌ๊ณ ์ปค๋ ํฌ๊ธฐ๋ฅผ ์ค์ด๋ฉด ํ๋ผ๋ฏธํฐ์ ์๊ฐ ์ค์ด๋๋๋ฐ, ํ๋ผ๋ฏธํฐ๊ฐ ์ค์ด๋ค๋ฉด ๋ชจ๋ธ์ด ํ์ตํ ์ ์๋ ํํ์ ์ ์ฌ์ ๊ฐ์ง์๊ฐ ์ค์ด๋๋ ๊ฒ์ด ์๋๊ฐ ํ๋ ์ด์ผ๊ธฐ๊ฐ ๋์๋ค.
MLP ๋ชจ๋ธ๊ณผ ์ข ํท๊ฐ๋ ธ๋๋ฐ, ํ ์ ๋์ ๋ด๋ฆฐ ๊ฒฐ๋ก ์ ๋ค์๊ณผ ๊ฐ๋ค.
ํ์คํ๊ฒ ๊ฒฐ๋ก ์ ๋ด๋ฆด ์๊ฐ ์์๋๋ฐ, ์กฐ๋ง๊ฐ ์ด์ ๋ํด ์กฐ๊ต๋๋ค๊ป ์ง๋ฌธํด ๋ณด๋ ค๊ณ ํ๋ค.