CNN (Convolutional Neural Networks)

์ฐฝ์Šˆยท2025๋…„ 4์›” 4์ผ

Deep Learning

๋ชฉ๋ก ๋ณด๊ธฐ
5/16
post-thumbnail

๐Ÿ“ธ ๋”ฅ๋Ÿฌ๋‹์˜ ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜ ์„ฑ๊ณต ์‚ฌ๋ก€

์‹ ๊ฒฝ๋ง(Neural Network) ์€ 2010๋…„๊ฒฝ๋ถ€ํ„ฐ ๋‹ค์‹œ ์ฃผ๋ชฉ๋ฐ›๊ธฐ ์‹œ์ž‘ํ–ˆ๊ณ ,
์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜(image classification) ๋ถ„์•ผ์—์„œ ํฐ ์„ฑ๊ณต์„ ๊ฑฐ๋‘์—ˆ๋‹ค.


๐Ÿ–ผ๏ธ CIFAR (Canadian Institute for Advanced Research):

๊ธฐ๊ด€์—์„œ ๋งŒ๋“  ์†Œํ˜• ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜์šฉ ๋ฐ์ดํ„ฐ์…‹

CIFAR-100 ๋ฐ์ดํ„ฐ์…‹

  • ์ด 60,000๊ฐœ์˜ ์ปฌ๋Ÿฌ ์ด๋ฏธ์ง€๋กœ ๊ตฌ์„ฑ
  • 20๊ฐœ์˜ ์ƒ์œ„(superclass) ์นดํ…Œ๊ณ ๋ฆฌ๋งˆ๋‹ค 5๊ฐœ์˜ ํ•˜์œ„ ํด๋ž˜์Šค๊ฐ€ ์žˆ์–ด ์ด 100๊ฐœ ํด๋ž˜์Šค
  • ์ด๋ฏธ์ง€ ํฌ๊ธฐ: 32 ร— 32, ์ปฌ๋Ÿฌ ์ด๋ฏธ์ง€ (RGB)
    - ๊ฐ ์ด๋ฏธ์ง€๋Š” 32 ร— 32 ร— 3 ํฌ๊ธฐ์˜ 3์ฐจ์› ๋ฐฐ์—ด
    - ๊ฐ ์ฑ„๋„์€ 8๋น„ํŠธ ์ •์ˆ˜๊ฐ’ (0~255) ๋กœ ์ƒ‰์ƒ ํ‘œํ˜„ (๋นจ๊ฐ•, ์ดˆ๋ก, ํŒŒ๋ž‘)
  • ํ•™์Šต ๋ฐ์ดํ„ฐ: 50,000๊ฐœ
  • ํ…Œ์ŠคํŠธ ๋ฐ์ดํ„ฐ: 10,000๊ฐœ

๐Ÿง  Convolutional Neural Networks (CNNs)

CNN์€ ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜๋ฅผ ์œ„ํ•ด ๋ฐœ์ „๋œ ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ ๊ตฌ์กฐ
๋‹ค์–‘ํ•œ ์ด๋ฏธ์ง€ ๊ด€๋ จ ๋ฌธ์ œ์— ๋Œ€ํ•ด ๋†€๋ผ์šด ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์ฃผ๋ฉฐ ๋ฐœ์ „ํ•ด์™”๋‹ค.
์˜ˆ: ๊ฐ์ฒด ์ธ์‹, ์–ผ๊ตด ์ธ์‹, ์ž์œจ ์ฃผํ–‰ ๋“ฑ

  • CNN์€ ์ธ๊ฐ„์˜ ์‹œ๊ฐ ์‹œ์Šคํ…œ๊ณผ ๋น„์Šทํ•˜๋‹ค.
  • ์ด๋ฏธ์ง€๋ฅผ ๊ณ„์ธต์ (hierarchical) ์œผ๋กœ ์ธ์‹ํ•œ๋‹ค:
    • ๋จผ์ € ๊ฐ€์žฅ์ž๋ฆฌ(Edge), ๊ธฐ๋ณธ์ ์ธ ํ˜•ํƒœ(Shape) ๋“ฑ์„ ์ธ์‹ํ•˜๊ณ ,
    • ์ ์  ๋” ๋ณต์žกํ•œ ๊ตฌ์กฐ๋กœ ์กฐํ•ฉํ•ด ๊ฐ€๋ฉฐ ์ „์ฒด ์ด๋ฏธ์ง€(๊ฐ์ฒด) ๋ฅผ ์ธ์‹ํ•œ๋‹ค.
  • ์ด ๊ณ„์ธต์  ์ธ์‹์€ ํ•ฉ์„ฑ๊ณฑ(convolution) ๊ณผ ํ’€๋ง(pooling) ๊ณ„์ธต์„ ํ†ตํ•ด ์ด๋ฃจ์–ด์ง„๋‹ค.

ํ•ฉ์„ฑ๊ณฑ ๊ณ„์ธต (Convolution Layer)

์ด๋ฏธ์ง€ ์†์—์„œ ์ž‘์€ ํŒจํ„ด(์˜ˆ: ์„ , ๋ชจ์„œ๋ฆฌ ๋“ฑ) ์„ ์ฐพ์•„๋‚ธ๋‹ค.
ํ•„ํ„ฐ(๋˜๋Š” ์ปค๋„)๋ฅผ ์ด๋ฏธ์ง€์— ์Šฌ๋ผ์ด๋”ฉํ•˜๋ฉฐ ํŠน์ง•(feature)์„ ์ถ”์ถœํ•œ๋‹ค.

ํ’€๋ง ๊ณ„์ธต (Pooling Layer)

์•ž์—์„œ ์ถ”์ถœํ•œ ํŠน์ง•์„ ์š”์•ฝ/์ถ•์†Œํ•˜๋Š” ์—ญํ• ์„ ํ•œ๋‹ค.
๊ฐ€์žฅ ๋Œ€ํ‘œ์ ์ธ ์ •๋ณด๋ฅผ ๋ฝ‘์•„๋‚ด์–ด ๊ณต๊ฐ„ ํฌ๊ธฐ๋ฅผ ์ค„์ด๊ณ , ๊ณ„์‚ฐ ํšจ์œจ์„ ๋†’์ธ๋‹ค.


๐Ÿ” ํ•ฉ์„ฑ๊ณฑ ๊ณ„์ธต (Convolution Layer)

ํ•ฉ์„ฑ๊ณฑ ๊ณ„์ธต์€ ์—ฌ๋Ÿฌ ๊ฐœ์˜ ํ•„ํ„ฐ(filter)๋กœ ๊ตฌ์„ฑ๋˜์–ด ์žˆ์Œ

ํ•ฉ์„ฑ๊ณฑ ํ•„ํ„ฐ๋Š” ์ด๋ฏธ์ง€ ์†์—์„œ ํŠน์ •ํ•œ ์ง€์—ญ์ ์ธ ํŒจํ„ด(local feature) ์ด ์กด์žฌํ•˜๋Š”์ง€๋ฅผ ํŒ๋‹จํ•˜๋Š” ์ž‘์€ ํ…œํ”Œ๋ฆฟ

ํ•„ํ„ฐ๋Š” ํ•™์Šต์„ ํ†ตํ•ด ์ตœ์ ํ™”๋จ


๐Ÿ–‡๏ธ ํ•ฉ์„ฑ๊ณฑ ์—ฐ์‚ฐ

๋งค์šฐ ๋‹จ์ˆœํ•œ ์—ฐ์‚ฐ์ธ ํ•ฉ์„ฑ๊ณฑ(dot product) ์„ ์‚ฌ์šฉํ•จ

์ด๋ฏธ์ง€ ์œ„๋ฅผ ํ•„ํ„ฐ๊ฐ€ ์Šฌ๋ผ์ด๋”ฉํ•˜๋ฉด์„œ local feature์˜ ํŠน์ง•์„ ์žก์•„ ๊ฐ ์˜์—ญ๊ณผ์˜ ์œ ์‚ฌ๋„๋ฅผ ๊ณ„์‚ฐํ•จ

โœ… ์˜ˆ์‹œ
์ž…๋ ฅ ์ด๋ฏธ์ง€ (4ร—3):

[abcdefghijkl]\begin{bmatrix} a & b & c \\ d & e & f \\ g & h & i \\ j & k & l \end{bmatrix}

ํ•„ํ„ฐ (2ร—2):

[ฮฑฮฒฮณฮด]\begin{bmatrix} \alpha & \beta \\ \gamma & \delta \end{bmatrix}

์ถœ๋ ฅ ์ด๋ฏธ์ง€ (ํ•ฉ์„ฑ๊ณฑ ๊ฒฐ๊ณผ):

[aฮฑ+bฮฒ+dฮณ+eฮดbฮฑ+cฮฒ+eฮณ+fฮดdฮฑ+eฮฒ+gฮณ+hฮดeฮฑ+fฮฒ+hฮณ+iฮดgฮฑ+hฮฒ+jฮณ+kฮดhฮฑ+iฮฒ+kฮณ+lฮด]\begin{bmatrix} a\alpha + b\beta + d\gamma + e\delta & b\alpha + c\beta + e\gamma + f\delta \\ d\alpha + e\beta + g\gamma + h\delta & e\alpha + f\beta + h\gamma + i\delta \\ g\alpha + h\beta + j\gamma + k\delta & h\alpha + i\beta + k\gamma + l\delta \end{bmatrix}

์ด ๊ฒฐ๊ณผ๋Š” ์›๋ณธ ์ด๋ฏธ์ง€ ์ค‘, ํ•„ํ„ฐ์™€ ๋น„์Šทํ•œ ๋ถ€๋ถ„์— ๋†’์€ ์ ์ˆ˜๋ฅผ ๋ถ€์—ฌํ•จ

โ€ผ๏ธ ํ•„ํ„ฐ๊ฐ€ 2ร—2์ด๊ธฐ ๋•Œ๋ฌธ์— dimenssion์ด ํ•˜๋‚˜์”ฉ ์ค„์–ด๋“ ๋‹ค. if 3ร—3 ์ด์—ˆ๋‹ค๋ฉด ๋‘˜ ์”ฉ ์ค„์—ˆ์„ ๊ฒƒ.

๋งŒ์•ฝ ๋งž์ง€ ์•Š์œผ๋ฉด padding True ์˜ต์…˜์„ ํ†ตํ•ด ํฌ๊ธฐ๋ฅผ ๋งž์ถ”์–ด ์คŒ


๐Ÿ–‡๏ธ ๊ฐ ํ•„ํ„ฐ์˜ ํ•™์Šต

ํ•„ํ„ฐ๋Š” ๋‹จ์ˆœํ•œ ์„ , ๋ชจ์„œ๋ฆฌ ๋“ฑ ์ž‘์€ ํ˜•ํƒœ(shape) ๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” ์ž‘์€ ์ด๋ฏธ์ง€๋กœ ๋ณผ ์ˆ˜ ์žˆ๋‹ค

ํ›ˆ๋ จ ์ค‘ ํ•™์Šต๋จ (backpropagation์œผ๋กœ ์ตœ์ ํ™”๋จ)

์ž…๋ ฅ ์ด๋ฏธ์ง€์™€ ํ•„ํ„ฐ์˜ ๋„ํŠธ๊ณฑ(dot product) ์œผ๋กœ ์œ ์‚ฌ๋„๋ฅผ ๊ณ„์‚ฐ

์œ ์‚ฌํ•œ ์ง€์—ญ์ด๋ฉด ๋†’์€ ๊ฐ’, ๋‹ค๋ฅด๋ฉด ๋‚ฎ์€ ๊ฐ’ ์ถœ๋ ฅ


๐Ÿ–‡๏ธ ์ด๋ฏธ์ง€์˜ ํ•ฉ์„ฑ๊ณฑ

- `์ˆ˜์ง ํ•„ํ„ฐ`๋Š” ์ˆ˜์ง ์ค„๋ฌด๋Šฌ๋‚˜ ๋ชจ์„œ๋ฆฌ๋ฅผ ๊ฐ•์กฐํ•˜๊ณ , - `์ˆ˜ํ‰ ํ•„ํ„ฐ`๋Š” ์ˆ˜ํ‰ ์ค„๋ฌด๋Šฌ๋‚˜ ์—ฃ์ง€๋ฅผ ๊ฐ•์กฐํ•œ๋‹ค.

โœ”๏ธ RGB ์ปฌ๋Ÿฌ ์ด๋ฏธ์ง€์˜ ๊ตฌ์กฐ

  • ์ปฌ๋Ÿฌ ์ด๋ฏธ์ง€๋Š” 3๊ฐœ์˜ ์ƒ‰์ƒ ์ฑ„๋„(R, G, B) ๋กœ ๊ตฌ์„ฑ๋œ๋‹ค.
  • ๊ฐ ์ฑ„๋„์€ ๋…๋ฆฝ์ ์ธ 2์ฐจ์› ๋ฐฐ์—ด(feature map) ์ด๋‹ค.
    ์˜ˆ: ์ด๋ฏธ์ง€ ํ•˜๋‚˜ = 3๊ฐœ์˜ 32ร—32 ๋ฐฐ์—ด (Red, Green, Blue)

โœ”๏ธ ํ•„ํ„ฐ์˜ ๊ตฌ์„ฑ

  • ํ•˜๋‚˜์˜ ํ•ฉ์„ฑ๊ณฑ ํ•„ํ„ฐ๋„ 3๊ฐœ์˜ ์ฑ„๋„์„ ๊ฐ€์ง€๊ณ  ์žˆ์œผ๋ฉฐ,
    ๊ฐ ์ฑ„๋„์€ ๋ณดํ†ต 3ร—3 ํฌ๊ธฐ์˜ ๊ฐ€์ค‘์น˜ ํ–‰๋ ฌ๋กœ ๊ตฌ์„ฑ๋œ๋‹ค.
  • ๊ฐ ์ฑ„๋„๋งˆ๋‹ค ๋‹ค๋ฅธ ๊ฐ€์ค‘์น˜๋ฅผ ๊ฐ€์งˆ ์ˆ˜ ์žˆ๋‹ค.

โœ”๏ธ ์—ฐ์‚ฐ ๊ณผ์ •

  • ํ•„ํ„ฐ์˜ ๊ฐ ์ฑ„๋„์„ ์ž…๋ ฅ ์ด๋ฏธ์ง€์˜ ๋Œ€์‘ ์ฑ„๋„๊ณผ ๊ฐ๊ฐ ํ•ฉ์„ฑ๊ณฑ(convolution) ํ•œ๋‹ค.
  • ๊ทธ ๊ฒฐ๊ณผ ๋‚˜์˜จ 3๊ฐœ์˜ feature map์„ ํ•ฉ์‚ฐ(summing) ํ•˜์—ฌ
    ์ตœ์ข…์ ์œผ๋กœ 2์ฐจ์› ์ถœ๋ ฅ feature map ํ•˜๋‚˜๋ฅผ ์ƒ์„ฑํ•œ๋‹ค.
  • ์ด ์ถœ๋ ฅ์€ ReLU ํ•จ์ˆ˜๋ฅผ ํ†ตํ•ด ๋น„์„ ํ˜• ๋ณ€ํ™˜๋œ๋‹ค:

โœ… ๊ฒฐ๊ณผ์ ์œผ๋กœ ํ•„ํ„ฐ๋Š” ์ด๋ฏธ์ง€ ์† ํŠน์ง•(์„ , ๋ชจ์„œ๋ฆฌ ๋“ฑ)์„ ๊ฐ์ง€ํ•˜๊ณ , ํŠน์ง• ๋งต(feature map) ์— ๊ทธ ๊ฐ•๋„๋ฅผ ํ‘œํ˜„ํ•˜๊ฒŒ ๋œ๋‹ค.


๐Ÿ”ฝ ํ’€๋ง ๊ณ„์ธต (Pooling Layer)

์ด๋ฏธ์ง€์˜ ํฌ๊ธฐ๋ฅผ ์ค„์ด๊ณ , ํ•ต์‹ฌ ์ •๋ณด๋งŒ ์š”์•ฝํ•˜๋Š” ์—ญํ• ์„ ํ•จ
์ •๋ณด ์••์ถ• + ์œ„์น˜ ๋ถˆ๋ณ€์„ฑ ํ™•๋ณด๋ฅผ ๋™์‹œ์— ํ•ด์ฃผ๋Š” ๋‹จ๊ณ„


๐Ÿ”  Max Pooling

[1253301221341120]\begin{bmatrix} 1 & 2 & 5 & 3 \\ 3 & 0 & 1 & 2 \\ 2 & 1 & 3 & 4 \\ 1 & 1 & 2 & 0 \end{bmatrix} โ†’ [3524]\begin{bmatrix} 3 & 5 \\ 2 & 4 \end{bmatrix}

๐Ÿ“ ํšจ๊ณผ

  • ์ด๋ฏธ์ง€ ํฌ๊ธฐ๋ฅผ ๊ฐ€๋กœ ร— ์„ธ๋กœ ๋ชจ๋‘ ์ ˆ๋ฐ˜์œผ๋กœ ์ถ•์†Œ
  • ์ „์ฒด์ ์œผ๋กœ๋Š” ์ฐจ์›์„ 1/4๋กœ ์ค„์ž„
  • ์—ฐ์‚ฐ๋Ÿ‰ ๊ฐ์†Œ + ๋ชจ๋ธ์ด ๋” ์ค‘์š”ํ•œ ํŠน์ง•์— ์ง‘์ค‘ํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋„์™€์คŒ

๐Ÿ“Œ ์œ„์น˜ ๋ถˆ๋ณ€์„ฑ

  • ๋ธ”๋ก ์•ˆ์— ํฐ ๊ฐ’์ด ์–ด๋А ์œ„์น˜์— ์žˆ๋“ , ์ตœ๋Œ“๊ฐ’๋งŒ์„ ์„ ํƒํ•˜๋ฏ€๋กœ ์œ„์น˜ ๋ณ€ํ™”์— ๋œ ๋ฏผ๊ฐํ•จ
  • ์ฆ‰, ๊ฐ™์€ ํŠน์ง•์ด ์•ฝ๊ฐ„ ์ด๋™ํ•ด๋„ ์ž˜ ๊ฐ์ง€ํ•  ์ˆ˜ ์žˆ์Œ

โœ”๏ธ CNN์˜ ๊ตฌ์กฐ

์ผ๋ฐ˜์ ์ธ `CNN`์€ ์—ฌ๋Ÿฌ ๊ฐœ์˜ `ํ•ฉ์„ฑ๊ณฑ ์ธต`(convolution layers) ๊ณผ `ํ’€๋ง ์ธต`(pooling layers) ์œผ๋กœ ๊ตฌ์„ฑ๋จ ex) ํ•ฉ์„ฑ๊ณฑ 3๊ฐœ + ํ’€๋ง 3๊ฐœ ์กฐํ•ฉ - ํ•„ํ„ฐ๋Š” ์ผ๋ฐ˜์ ์œผ๋กœ ์ž‘์€ ํฌ๊ธฐ (์˜ˆ: 2ร—2, 3ร—3)๋ฅผ - ๊ฐ ํ•„ํ„ฐ๋Š” ์ž…๋ ฅ ์ด๋ฏธ์ง€๋กœ๋ถ€ํ„ฐ ํ•˜๋‚˜์˜ ์ƒˆ๋กœ์šด ์ฑ„๋„(feature map) ์„ ์ƒ์„ฑํ•จ

  • ํ’€๋ง์„ ํ†ตํ•ด ๊ณต๊ฐ„ ํฌ๊ธฐ(๊ฐ€๋กœ, ์„ธ๋กœ)๋Š” ๊ฐ์†Œํ•˜์ง€๋งŒ, ์ฑ„๋„ ์ˆ˜(= ํ•„ํ„ฐ ์ˆ˜)๋Š” ์ ์  ์ฆ๊ฐ€ํ•˜๋Š” ๊ฒƒ์ด ์ผ๋ฐ˜์ 
    ์ด๋ฏธ์ง€ ํฌ๊ธฐ โฌ‡๏ธ ์ฑ„๋„ ์ˆ˜ โฌ†๏ธ โ†’ ์ •๋ณด ์š”์•ฝ์€ ๋˜์ง€๋งŒ ํ‘œํ˜„๋ ฅ์€ ๋” ํ’๋ถ€ํ•ด์ง

ResNet-50: ์ด๋ฏธ์ง€๋„ท(Imagenet) ์˜ 1000๊ฐœ ํด๋ž˜์Šค ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜์— ์‚ฌ์šฉ๋จ, ๋ฌด๋ ค 50๊ฐœ์˜ ์ธต(layer) ์œผ๋กœ ๊ตฌ์„ฑ๋œ ๋งค์šฐ ๊นŠ์€ ๋„คํŠธ์›Œํฌ


๐Ÿ“ˆ Data Augmentation (๋ฐ์ดํ„ฐ ์ฆ๊ฐ•)

ํ•˜๋‚˜์˜ ํ•™์Šต ์ด๋ฏธ์ง€๋ฅผ ์—ฌ๋Ÿฌ ๋ฒˆ ๋ณต์ œํ•˜๊ณ , ๊ทธ ๋ณต์ œ๋ณธ๋งˆ๋‹ค ์ž์—ฐ์Šค๋Ÿฌ์šด ์™œ๊ณก์„ ์ ์šฉํ•˜๋Š” ๋ฐฉ์‹

์‚ฌ๋žŒ์ด ๋ณด๊ธฐ์—” ๊ฐ™์€ ์ด๋ฏธ์ง€๋กœ ์ธ์‹๋  ์ •๋„๋กœ ๋ฏธ์„ธํ•œ ๋ณ€ํ™”๋งŒ ์ฃผ๋ฉฐ, ๋Œ€ํ‘œ์ ์ธ ์˜ˆ๋กœ๋Š” ํ™•๋Œ€(zoom), ์ˆ˜ํ‰/์ˆ˜์ง ์ด๋™, ๊ธฐ์šธ์ž„(shear), ์ž‘์€ ํšŒ์ „, ์ขŒ์šฐ ๋ฐ˜์ „(horizontal flip) ๋“ฑ์ด ์žˆ๋‹ค.

๊ฐ™์€ ์ •๋‹ต ๋ผ๋ฒจ์„ ๊ณต์œ ํ•˜๋ฉฐ, ๊ฒฐ๊ณผ์ ์œผ๋กœ ํ•™์Šต ๋ฐ์ดํ„ฐ์˜ ์–‘์„ ํšจ๊ณผ์ ์œผ๋กœ ์ฆ๊ฐ€์‹œํ‚ค๋Š” ํšจ๊ณผ๋ฅผ ๋‚ธ๋‹ค.
์ด๋Š” ๋ชจ๋ธ์ด ๊ณผ์ ํ•ฉ(overfitting) ๋˜๋Š” ๊ฒƒ์„ ๋ฐฉ์ง€ํ•˜๊ณ , ๋” ์ผ๋ฐ˜ํ™”๋œ ํŠน์„ฑ์„ ํ•™์Šตํ•  ์ˆ˜ ์žˆ๋„๋ก ๋„์™€์ค€๋‹ค.

์ด๋Ÿฌํ•œ ๋ฐฉ์‹์€ ์ผ์ข…์˜ ์ •๊ทœํ™”(regularization) ๊ธฐ๋ฒ•์œผ๋กœ ๋ณผ ์ˆ˜ ์žˆ๋Š”๋ฐ, ํ•˜๋‚˜์˜ ์›๋ณธ ์ด๋ฏธ์ง€๋ฅผ ์ค‘์‹ฌ์œผ๋กœ ๋‹ค์–‘ํ•œ ๋ณ€ํ˜• ์ด๋ฏธ์ง€๋“ค์ด ํ•˜๋‚˜์˜ "์ด๋ฏธ์ง€ ๊ตฌ๋ฆ„(image cloud)" ์„ ์ด๋ฃจ๊ฒŒ ๋˜๊ณ , ์ด๋Š” ๋ชจ๋ธ์ด ์ž‘์€ ๋ณ€ํ™”์— ๊ฐ•๊ฑดํ•œ ํ˜•ํƒœ๋กœ ํ•™์Šต๋˜๋„๋ก ์œ ๋„ํ•œ๋‹ค.


๐Ÿ“Œ ResNet50์„ ํ™œ์šฉํ•œ ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜

์ด ํ™•๋ฅ  ๊ฐ’์€ ํ•ด๋‹น ์ด๋ฏธ์ง€๊ฐ€ ๊ฐ ํด๋ž˜์Šค์— ์†ํ•  ๊ฐ€๋Šฅ์„ฑ์„ ๋‚˜ํƒ€๋‚ด๋Š” ๊ฐ’์œผ๋กœ, ์ด 100๊ฐœ์˜ ํด๋ž˜์Šค ์ค‘ ๋ชจ๋ธ์ด ๊ฐ€์žฅ ์ž์‹  ์žˆ์–ด ํ•˜๋Š” 3๊ฐœ ์„ ํƒ์ง€๋ฅผ ๋ณด์—ฌ์ค€๋‹ค.
์ด๋Ÿฌํ•œ ๋ฐฉ์‹์€ ๋‹จ์ˆœํžˆ ์ •๋‹ต ์—ฌ๋ถ€๋ฅผ ๋„˜์–ด์„œ, ๋ชจ๋ธ์ด ์˜ˆ์ธก์— ๋Œ€ํ•ด ์–ด๋А ์ •๋„์˜ ํ™•์‹ ์„ ๊ฐ€์ง€๊ณ  ์žˆ๋Š”์ง€๊นŒ์ง€ ํ™•์ธํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ด์ฃผ๋ฉฐ, ๋ถ„๋ฅ˜๊ธฐ์˜ ์„ฑ๋Šฅ์„ ๋ณด๋‹ค ์ž…์ฒด์ ์œผ๋กœ ์ดํ•ดํ•˜๋Š” ๋ฐ ๋„์›€์ด ๋œ๋‹ค.


4D Tensor: (#Samples, Height, Width, #Channel)

0๊ฐœ์˜ ๋Œ“๊ธ€