ํฉ์ฑ๊ณฑ ์ ๊ฒฝ๋ง(CNN)์ ๊ณ ์ฐจ์ ๋ฐ์ดํฐ๋ฅผ ํจ์จ์ ์ผ๋ก ์ฒ๋ฆฌํ๊ณ , FCN(Fully Connected Network)์ ์ฐ์ฐ๋ ๋ฐ ์ค๋ฒํผํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ๋ฑ์ฅํ ๊ตฌ์กฐ์ ๋๋ค. ์ด๋ฏธ์ง ์ฒ๋ฆฌ๋ฟ ์๋๋ผ ์์ฑ, ์๊ณ์ด ๋ฑ ๋ค์ํ ๋๋ฉ์ธ์์ ํ์ฉ๋๊ณ ์์ต๋๋ค.
์ด๋ฏธ์ง์ฒ๋ผ ๊ณ ์ฐจ์ ๋ฐ์ดํฐ๋ฅผ FCN์ ์ ๋ ฅํ๋ฉด ์ฐ์ฐ๋์ด ํญ์ฆ
๋ชจ๋ ๋ ธ๋๊ฐ ์๋ก ์ฐ๊ฒฐ๋์ด ์ค๋ฒํผํ ์ํ ์ฆ๊ฐ
๋ณ์ ๊ณต์ (Weight Sharing) : ํ๋์ ํํฐ๋ฅผ ์ฌ๋ฌ ์์น์์ ์ฌ์ฌ์ฉ
ํฌ์ ์ฐ๊ฒฐ(Sparse Connectivity) : ์ ๋ ฅ ์ ์ฒด๊ฐ ์๋๋ผ ์ผ๋ถ ์์ญ๋ง ์ฐ๊ฒฐ (๋ก์ปฌ ํน์ฑ ์ถ์ถ)
์ผ๋ฐ์ ์ธ ๋ด๋ฐ ์ฐ์ฐ:
CNN์ ์ด๋ฅผ 2์ฐจ์ ๊ตฌ์กฐ๋ก ํ์ฅํ์ฌ, ํํฐ๋ฅผ ํตํด ์ ๋ ฅ ๋ฐ์ดํฐ์์ ํน์ง์ ์ถ์ถ:
์ ๋ ฅ ์ด๋ฏธ์ง + ํํฐ = Feature Map
์ด ๊ณผ์ ์ ํตํด ํน์ ํจํด(๋ชจ์๋ฆฌ, ์ , ์ง๊ฐ ๋ฑ)์ ๊ฐ์ง
ํํฐ(Kernel):
๊ณ ์ ๋ ํฌ๊ธฐ์ ๊ฐ์ค์น ํ๋ ฌ
๊ฐ ํํฐ๋ ์
๋ ฅ์ ํน์ง์ ์ถ์ถ (์: ๊ฒฝ๊ณ, ๋ชจ์)
์ฌ๋ฌ ๊ฐ์ ํํฐ ์ฌ์ฉ ์ฌ๋ฌ ๊ฐ์ ์ฑ๋ ์์ฑ
ํํฐ ์ ์ฉ ์กฐ๊ฑด:
์
๋ ฅ ์ฑ๋ ์ = ํํฐ ์ฑ๋ ์์ฌ์ผ ํจ
Padding:
์ด๋ฏธ์ง ๊ฒฝ๊ณ ์ ๋ณด๋ฅผ ๋ณด์กดํ๊ณ ์ถ์ ๋ฐฉ์ง
์ผ๋ฐ์ ์ผ๋ก same(ํฌ๊ธฐ ์ ์ง) or valid(ํฌ๊ธฐ ์ถ์)
Stride:
ํํฐ๊ฐ ์์ง์ด๋ ๊ฐ๊ฒฉ
๋๋ฌด ํฌ๋ฉด ์ ๋ณด ์์ค, ๋๋ฌด ์์ผ๋ฉด ์ฐ์ฐ๋ ๊ณผ๋ค
ํน์ง ๋งต(feature map)์ ์์ถํ๊ณ ์ค์ํ ์ ๋ณด๋ง ๋จ๊ธฐ๋ ๊ณผ์
๊ฐ์ฅ ํํ ์ฌ์ฉํ๋ ๋ฐฉ์ : MaxPooling
์ผ๋ฐ์ ์ผ๋ก 2x2 ํํฐ, stride=2
์ ์ฒด ํฌ๊ธฐ๋ฅผ ์ ๋ฐ์ผ๋ก ์ถ์
๋นํ์ต์ธต: ํ๋ผ๋ฏธํฐ ์์ โ ์ฐ์ฐ๋ง ์ํ
CNN์ ์ค๊ณํ ๋ ๊ณ ๋ คํ ์์:
ํํฐ ํฌ๊ธฐ (๋ณดํต 3x3, 5x5)
Stride (๋ณดํต 1)
Padding (same or valid)
ํํฐ ๊ฐ์ (์ฑ๋ ์ ์ฆ๊ฐ)
์ค์ง์ ์ธ ๊ตฌ์กฐ ์ค๊ณ์ ์ฑ๋ฅ ์ํฅ์ ๋ ผ๋ฌธ์ด๋ ์คํ ๊ฒฐ๊ณผ๋ฅผ ์ฐธ๊ณ ํด ์ต์ ํ
Input (์ด๋ฏธ์ง)
โ
[Conv โ ReLU โ Pool] ร N
โ
Flatten
โ
Fully Connected Layer (FCN)
โ
Softmax or Logistic (๋ถ๋ฅ)
Conv + Pool์ ํ๋์ Layer ๋จ์๋ก ๋ณด๊ธฐ๋ ํจ
๋ง์ง๋ง ๋จ๊ณ์์๋ ์ฑ๋ ์๋ ๋ง๊ณ , ์ด๋ฏธ์ง ํฌ๊ธฐ๋ ์์์ง feature map์ ๋ฒกํฐ ํํ๋ก ๋ณํ ํ ๋ถ๋ฅ๊ธฐ ์ฐ๊ฒฐ
๐ฏ ๋ณ์ ๊ณต์ ๊ฐ์ ํํฐ๋ฅผ ์ฌ๋ฌ ์์น์ ์ฌ์ฉํ์ฌ ํ๋ผ๋ฏธํฐ ์ ๊ฐ์
๐ฏ ํฌ์ ์ฐ๊ฒฐ ์
๋ ฅ ์ผ๋ถ์๋ง ์ฐ๊ฒฐ๋์ด ๊ณ์ฐ๋ ๊ฐ์, ๊ณผ์ ํฉ ๋ฐฉ์ง
๐ฏ ์ง์ญ ํน์ง ์ธ์ ๊ณต๊ฐ ๊ตฌ์กฐ๊ฐ ์ค์ํ ๋ฐ์ดํฐ์ ์ต์ ํ
CNN์ ๊ตฌ์กฐ์ ์ผ๋ก ํจ์จ์ ์ด๊ณ , ์ด๋ฏธ์ง๋ ์๊ณ์ด๊ณผ ๊ฐ์ ๊ณต๊ฐ ์ ๋ณด๊ฐ ์ค์ํ ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ๋ ๋ฐ ์์ด ๊ฐ์ฅ ๋๋ฆฌ ์ฌ์ฉ๋๋ ์ ๊ฒฝ๋ง์ ๋๋ค.