[Week 3-3] ๐Ÿ’กCNN

Jadeยท2021๋…„ 2์›” 3์ผ
0

๋ถ€์ŠคํŠธ์บ ํ”„ AI Tech

๋ชฉ๋ก ๋ณด๊ธฐ
13/54

3์ฃผ์ฐจ ์ˆ˜์š”์ผ

  • CNN ๊ธฐ์ดˆ

๐Ÿ“[CNN ๊ธฐ์ดˆ]

MLP๋Š” ๊ฐ ๋‰ด๋Ÿฐ๋“ค์ด ์„ ํ˜• ๋ชจ๋ธ๊ณผ ํ™œ์„ฑ ํ•จ์ˆ˜๋กœ ์™„์ „ํžˆ ์—ฐ๊ฒฐ๋œ(fully-connected) ๊ตฌ์กฐ > ๋ชจ๋ธ์˜ ๊ทœ๋ชจ๊ฐ€ ์ปค์ง€๋ฉด ๊ฐ€์ค‘์น˜ ํŒŒ๋ผ๋ฏธํ„ฐ์˜ ์ˆ˜๋„ ์—„์ฒญ๋‚˜๊ฒŒ ๋งŽ์•„์ง„๋‹ค.

CNN(Convolutional Neural Network) ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜๊ฒŒ ๋˜๋ฉด ๊ธฐ์กด MLP ๋ชจ๋ธ์˜ ๊ฐ€์ค‘์น˜์™€๋Š” ๋‹ค๋ฅธ ๊ณ ์ •๋œ ์ˆ˜์˜ ์ปค๋„์„ ๊ฐ€์ค‘์น˜๋กœ ์‚ฌ์šฉํ•œ๋‹ค. ์ž…๋ ฅ ๋ฐ์ดํ„ฐ ์œ„์—์„œ ์ปค๋„์„ ์›€์ง์—ฌ ๊ฐ€๋ฉฐ ํ•ฉ์„ฑ๊ณฑ (convolution) ์—ฐ์‚ฐ์„ ์ˆ˜ํ–‰ํ•œ๋‹ค. ํ•˜๋‚˜์˜ ์ปค๋„์€ ์ž…๋ ฅ ๋ฐ์ดํ„ฐ ์œ„์—์„œ ์ด๋™ํ•˜๋”๋ผ๋„ ๊ทธ ๊ฐ’์ด ๋ฐ”๋€Œ์ง€ ์•Š๋Š”๋‹ค.

์ด๋ฏธ์ง€์— convolution์„ ์ ์šฉํ•˜๋ฉด ์‚ฌ์šฉํ•˜๋Š” ์ปค๋„์— ๋”ฐ๋ผ ๋‹ค๋ฅธ ํŠน์ง•์„ ์ถ”์ถœํ•ด ๋‚ผ ์ˆ˜ ์žˆ๋‹ค. (ํ๋ฆฌ๊ฒŒ ํ•˜๊ธฐ, ์™ธ๊ณฝ์„  ์ถ”์ถœ ๋“ฑ) CNN์€ ์ฃผ๋กœ ์ด๋ฏธ์ง€ ์ฒ˜๋ฆฌ์— ์‚ฌ์šฉํ•˜์ง€๋งŒ ์ž…๋ ฅ ๋ฐ์ดํ„ฐ๊ฐ€ ๋ฒกํ„ฐ์ผ ์ˆ˜๋„ ์žˆ๋‹ค (1d Convnet).

์ž…๋ ฅ ๋ฐ์ดํ„ฐ ์œ„๋ฅผ ์Šค์น˜๊ณ  ์ง€๋‚˜๊ฐ€๋Š” ์ปค๋„์˜ ํฌ๊ธฐ์— ๋”ฐ๋ผ ์ถœ๋ ฅ ๋ฐ์ดํ„ฐ์˜ ํฌ๊ธฐ๊ฐ€ ๋‹ฌ๋ผ์ง„๋‹ค. ์ž…๋ ฅ์ด H * W ํฌ๊ธฐ, ์ปค๋„์ด K_h * K_w ํฌ๊ธฐ, ์ถœ๋ ฅ์€ O_h * O_w ํฌ๊ธฐ๋ผ๊ณ  ํ•˜๋ฉด ์ด๋“ค์˜ ๊ด€๊ณ„๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.


์ปฌ๋Ÿฌ ์ด๋ฏธ์ง€๋Š” r/g/b ์ •๋ณด๋งŒ ๊ฐ€์ง€๊ณ  ์žˆ๋Š” ์ฑ„๋„์ด 3๊ฐœ ๋ชจ์—ฌ ๋งŒ๋“ค์–ด์ง€๋Š”๋ฐ, ์ปฌ๋Ÿฌ ์ด๋ฏธ์ง€๋ฅผ 2์ฐจ์› CNN์˜ ์ž…๋ ฅ์œผ๋กœ ์‚ฌ์šฉํ•  ๊ฒฝ์šฐ์—๋Š” convolution ์—ฐ์‚ฐ์„ ๊ฐ ์ฑ„๋„๋งˆ๋‹ค ์ ์šฉํ•˜๊ฒŒ ๋œ๋‹ค. ์ด ๋•Œ ์ปค๋„์˜ ์ˆ˜ ์—ญ์‹œ ์ฑ„๋„ ์ˆ˜์™€ ์ผ์น˜ํ•ด์•ผ ํ•œ๋‹ค.


[temp]

ILSVRC (ImageNet Large-Scale Visual Recognition Challenge) ์—์„œ ์ˆ˜์ƒํ•œ 5๊ฐœ์˜ CNN ๋ชจ๋ธ ๊ตฌ์กฐ

  • AlexNet (2011)
    ์ž…๋ ฅ๋ฐ์ดํ„ฐ์—์„œ 11x11 ์ปค๋„ ์‚ฌ์šฉํ•˜๋Š”๋ฐ ์ ์ฐจ 5x5> 3x3์œผ๋กœ ํฌ๊ธฐ ๊ฐ์†Œ, 5 conv๋ ˆ์ด์–ด, 3 dense๋ ˆ์ด์–ด
    key) ํ™œ์„ฑํ•จ์ˆ˜๋กœ ReLU ์‚ฌ์šฉ > ์ด ์‹œ์ ์—์„œ๋Š” ๋‹ค๋“ค? ์‹œ๊ทธ๋ชจ์ด๋“œ๋ฅผ ์ผ๋Š”๋ฐ ReLU๋ฅผ ์จ์„œ gradient vanishing ๋ฌธ์ œ ํ•ด๊ฒฐ๋จ
    GPU ์‚ฌ์šฉ
    Data augmentaition ์‚ฌ์šฉ
    Dropout ์‚ฌ์šฉ
    ์ง€๊ธˆ์€ ๋‹น์—ฐํ•ด ๋ณด์ด์ง€๋งŒ ๋‹น์‹œ์—๋Š” ํš๊ธฐ์ ์ธ ์•„์ด๋””์–ด์˜€์Œ. ์ง€๊ธˆ ์ž˜ ๋˜๋Š” ๋ชจ๋ธ๋“ค ๋ณด๋ฉด ๋‹ค ์ €๋Ÿฐ ํŠน์„ฑ์ด ์žˆ์ง€? ๋งํ•˜์ž๋ฉด ๊ธฐ์ค€์„ ์žก์•„์ค€ ๊ฒƒ

  • VGGNet (2015)
    3x3 ์ปค๋„๋งŒ์„ ์‚ฌ์šฉ, ๋ ˆ์ด์–ด ๊นŠ์ด๊ฐ€ ๊นŠ์–ด์ง(VGG16์€ 16๋ ˆ์ด์–ด, VGG19๋Š” 19๋ ˆ์ด์–ด), fully connected(dense) ๋ ˆ์ด์–ด์—์„œ๋Š” 1x1 convolutionํ•จ
    Dropout ์‚ฌ์šฉ
    3x3 ์ปค๋„๋กœ ๋ ˆ์ด์–ด ๋‘ ๊ฐœ ์Œ“์„ ๋•Œ๋ž‘ 5x5 ์ปค๋„๋กœ ๋ ˆ์ด์–ด ํ•œ ๊ฐœ ์Œ“์„ ๋•Œ ์–ป๋Š” ํŠน์„ฑ ๋งต์˜ ํฌ๊ธฐ๋Š” ๋™์ผํ•œ๋ฐ 3x3 ์ปค๋„์„ ์“ฐ๋ฉด ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜๊ฐ€ ๋” ์ค„์–ด๋“ ๋‹ค.

  • GoogLeNet (2014)
    Inception blocks๋ผ๊ณ  convolution ํ•˜๊ธฐ ์ „์— 1x1 conv๋ฅผ ํ•ด์„œ ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜๋ฅผ ์ค„์ด๋Š”๋ฐ ์ด๊ฒŒ ํ•ต์‹ฌ ์•„์ด๋””์–ด
    ์™œ? >


๐Ÿ‘จโ€๐Ÿ‘ฉโ€๐Ÿ‘งโ€๐Ÿ‘ฆ[ํ”ผ์–ด ์„ธ์…˜]

์–ด์ œ์™€ ๊ฐ™์ด, ํ•œ ๋ช…์”ฉ ์ „๋‚  ํ•™์Šตํ•œ ๋‚ด์šฉ์„ ๋ฏธ๋‹ˆ ์„ธ๋ฏธ๋‚˜ ํ˜•์‹์œผ๋กœ ๋ฐœํ‘œํ•˜๊ธฐ๋กœ ํ–ˆ๋‹ค. ์˜ค์ฐจ ์—ญ์ „ํŒŒ์— ์ด์•ผ๊ธฐ๋ฅผ ํ•˜๊ณ  ์‹œ๊ฐ„์ด ์ข€ ๋‚จ์•„์„œ ์˜ค๋Š˜ ๊ฐ•์˜ ์ค‘ CNN์—์„œ ๋ ˆ์ด์–ด ๊นŠ์ด๋ฅผ ๋Š˜๋ฆฌ๊ณ  ์ปค๋„ ํฌ๊ธฐ๋ฅผ ์ค„์ด๋Š” ๋‚ด์šฉ์„ ๋ณต์Šตํ•˜๋‹ค๊ฐ€ ํŒŒ๋ผ๋ฏธํ„ฐ์˜ ์ˆ˜๋ฅผ ์ค„์ด๋Š” ๊ฒƒ์ด ์™œ ํšจ๊ณผ์ ์ธ๊ฐ€์— ๋Œ€ํ•œ ์ด์•ผ๊ธฐ๋ฅผ ํ–ˆ๋‹ค.

์•„๋ž˜ ๊ทธ๋ฆผ๊ณผ ๊ฐ™์ด ๋ ˆ์ด์–ด ๊นŠ์ด๋ฅผ ๋Š˜๋ฆฌ๊ณ  ์ปค๋„ ํฌ๊ธฐ๋ฅผ ์ค„์ด๋ฉด ํŒŒ๋ผ๋ฏธํ„ฐ์˜ ์ˆ˜๊ฐ€ ์ค„์–ด๋“œ๋Š”๋ฐ, ํŒŒ๋ผ๋ฏธํ„ฐ๊ฐ€ ์ค„์–ด๋“ค๋ฉด ๋ชจ๋ธ์ด ํ•™์Šตํ•  ์ˆ˜ ์žˆ๋Š” ํ‘œํ˜„์˜ ์ž ์žฌ์  ๊ฐ€์ง“์ˆ˜๊ฐ€ ์ค„์–ด๋“œ๋Š” ๊ฒƒ์ด ์•„๋‹Œ๊ฐ€ ํ•˜๋Š” ์ด์•ผ๊ธฐ๊ฐ€ ๋‚˜์™”๋‹ค.

MLP ๋ชจ๋ธ๊ณผ ์ข€ ํ—ท๊ฐˆ๋ ธ๋Š”๋ฐ, ํ† ์˜ ๋์— ๋‚ด๋ฆฐ ๊ฒฐ๋ก ์€ ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.

  • CNN์—์„œ ๋ชจ๋ธ์ด ํ•™์Šตํ•˜๋Š” ํ‘œํ˜„์ด๋ž€ convolution ์—ฐ์‚ฐ์„ ํ†ตํ•ด ๋ฝ‘์•„๋‚ด๋Š” ํŠน์„ฑ ๋งต์ผ ๊ฒƒ๋‹ค.
  • ํŒŒ๋ผ๋ฏธํ„ฐ๊ฐ€ ๋„ˆ๋ฌด ๋งŽ์œผ๋ฉด ํŠน์„ฑ์— ๊ด€๋ จ๋œ ์ •๋ณด๋ฟ์ด ์•„๋‹ˆ๋ผ ๋ณ„ ๊ด€๊ณ„ ์—†๋Š” ๋ถˆํ•„์š”ํ•œ ์ •๋ณด๋„ ๋‹ค ํ•™์Šตํ•ด ๋ฒ„๋ ค์„œ ์ž…๋ ฅ ๋ฐ์ดํ„ฐ์— ์œ ์ฐฉ๋  ๊ฐ€๋Šฅ์„ฑ์ด ์žˆ์–ด ๊ณผ์ ํ•ฉ๋  ์œ„ํ—˜์ด ์žˆ์„ ๊ฒƒ์ด๋‹ค.

ํ™•์‹คํ•˜๊ฒŒ ๊ฒฐ๋ก ์„ ๋‚ด๋ฆด ์ˆ˜๊ฐ€ ์—†์—ˆ๋Š”๋ฐ, ์กฐ๋งŒ๊ฐ„ ์ด์— ๋Œ€ํ•ด ์กฐ๊ต๋‹˜๋“ค๊ป˜ ์งˆ๋ฌธํ•ด ๋ณด๋ ค๊ณ  ํ•œ๋‹ค.

profile
๋ฐ˜๊ฐ€์›Œ์šฉ

0๊ฐœ์˜ ๋Œ“๊ธ€