[Week 7-1] ๐Ÿ‘€์ปดํ“จํ„ฐ ๋น„์ „

Jadeยท2021๋…„ 3์›” 8์ผ
0

๋ถ€์ŠคํŠธ์บ ํ”„ AI Tech

๋ชฉ๋ก ๋ณด๊ธฐ
29/54

7์ฃผ์ฐจ ์›”์š”์ผ

  • ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜
  • ๋ฐ์ดํ„ฐ ๋ถ€์กฑ ํ•ด๊ฒฐํ•˜๊ธฐ

๐Ÿ“[์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜]

  • Classifier : ์ž…๋ ฅ๋œ ์ด๋ฏธ์ง€๋ฅผ ์นดํ…Œ๊ณ ๋ฆฌ(ํด๋ž˜์Šค)๋กœ ๋งคํ•‘ํ•ด ์ฃผ๋Š” ๋ชจ๋ธ
    ๋งŒ์•ฝ ์„ธ์ƒ์˜ ๋ชจ๋“  ๋ฐ์ดํ„ฐ๋ฅผ ๋‹ค ๊ฐ€์ง€๊ณ  ์žˆ๋‹ค๋ฉด nearest neighbor ์•Œ๊ณ ๋ฆฌ์ฆ˜์œผ๋กœ ์ด๋ฏธ์ง€๋ฅผ ๊ฐ„ํŽธํ•˜๊ฒŒ ๋ถ„๋ฅ˜ํ•  ์ˆ˜ ์žˆ์„ ๊ฒƒ์ด๋‹ค. ํ•˜์ง€๋งŒ ์„ธ์ƒ์— ์กด์žฌํ•˜๋Š” ๋ฐ์ดํ„ฐ๋Š” ๋ฌดํ•œํ•˜๋ฏ€๋กœ ์‹œ๊ฐ„/๊ณต๊ฐ„ ๋ณต์žก๋„๊ฐ€ ๋ฌดํ•œ๋Œ€๋ผ์„œ ์ด ๋ฐฉ๋ฒ•์€ ์‹คํ˜„ํ•  ์ˆ˜ ์—†๋‹ค. ๋”ฐ๋ผ์„œ ๋ฐ์ดํ„ฐ๋ฅผ ์••์ถ•ํ•ด์„œ ์‹ ๊ฒฝ๋ง ๋ชจ๋ธ์˜ ํŒŒ๋ผ๋ฏธํ„ฐ์— ๋…น์—ฌ์•ผ ํ•œ๋‹ค.
    k-nearest neighbors : ์ฃผ์–ด์ง„ ๋ฐ์ดํ„ฐ์˜ ์ฃผ๋ณ€ ์ด์›ƒ k๊ฐœ๋ฅผ ํ†ตํ•ด ํ•ด๋‹น ๋ฐ์ดํ„ฐ๋ฅผ ๋ถ„๋ฅ˜ํ•˜๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜

    ์ด๋ฏธ์ง€๋ฅผ ๋ถ„๋ฅ˜ํ•˜๋Š” ๋ชจ๋ธ์„ ๋งŒ๋“ค ๋•Œ๋Š” ์ด๋ฏธ์ง€์˜ ํ”ฝ์…€ ํ•˜๋‚˜ํ•˜๋‚˜๋ฅผ ์ž…๋ ฅ์œผ๋กœ ๊ฐ„์ฃผํ•˜๋Š” Fully connected MLP ๋ชจ๋ธ์„ ๋งŒ๋“ค ์ˆ˜๋„ ์žˆ๊ณ , ์ด๋ฏธ์ง€ ์œ„์—์„œ ํ•„ํ„ฐ๋ฅผ ์›€์ง์—ฌ(sliding window) ์ด๋ฏธ์ง€ ๋‚ด์˜ ์ง€์—ญ์  ํŒจํ„ด(ํŠน์„ฑ ๋งต)์„ ์ถ”์ถœํ•˜๋Š” CNN ๋ชจ๋ธ์„ ๋งŒ๋“ค ์ˆ˜๋„ ์žˆ๋‹ค. FC ๋ ˆ์ด์–ด๋กœ ๋งŒ๋“  MLP ๋ชจ๋ธ์€ CNN์— ๋น„ํ•ด ์„ฑ๋Šฅ์ด ๋‹ค์†Œ ๋–จ์–ด์ง„๋‹ค. ํ•™์Šต์— ์‚ฌ์šฉ๋œ ์ด๋ฏธ์ง€์˜ ํ˜•ํƒœ๋ฅผ ์ผ์ข…์˜ ํ…œํ”Œ๋ฆฟ์ฒ˜๋Ÿผ ๊ทธ๋Œ€๋กœ ํ•™์Šตํ•˜๋Š”๋ฐ, ๋•Œ๋ฌธ์— ์ด๋ฏธ์ง€์˜ ์ผ๋ถ€๋ฅผ ํฌ๋กญํ•ด์„œ ์ž…๋ ฅ์œผ๋กœ ์ง‘์–ด๋„ฃ์œผ๋ฉด ์•Œ์•„๋ณด์ง€ ๋ชปํ•œ๋‹ค. CNN ๋ชจ๋ธ์€ ์ด๋ฏธ์ง€ ๋‚ด์˜ ์ง€์—ญ์  ํŠน์ง•์„ ์ถ”์ถœํ•˜๊ธฐ ๋•Œ๋ฌธ์— ๋‹ค๋ฅธ ๊ฐ๋„์—์„œ ์ฐ์€ ์‚ฌ์ง„์ด๋‚˜ ํฌ๋กญ๋œ ์ด๋ฏธ์ง€ ๋“ฑ ํ•™์Šตํ•œ ์ด๋ฏธ์ง€์™€ ์œ ์‚ฌํ•œ ํŒจํ„ด์ด ์ž…๋ ฅ๋  ๋•Œ ์ด๋ฅผ ์•Œ์•„๋ณผ ์ˆ˜ ์žˆ๋‹ค.

    CNN ๋ชจ๋ธ์€ ์ด๋ฏธ์ง€๋ฅผ ๋‹ค๋ฃจ๋Š” ๋ฐ ๊ฐ•๋ ฅํ•œ ์„ฑ๋Šฅ์„ ๋ณด์ด๋Š”๋ฐ, ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜๋‚˜ ์˜์—ญ ๊ฒ€์ถœ ๋“ฑ ์—ฌ๋Ÿฌ ๊ฐ€์ง€ ์ปดํ“จํ„ฐ ๋น„์ „ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•  ๋•Œ backbone ๋ชจ๋ธ๋กœ ์‚ฌ์šฉ๋œ๋‹ค.

๐Ÿ“[๋ฐ์ดํ„ฐ ๋ถ€์กฑ ํ•ด๊ฒฐํ•˜๊ธฐ]

  • Data augmentation
    ์‹ ๊ฒฝ๋ง์˜ ํ•™์Šต์€ ๋ฐ์ดํ„ฐ์—์„œ ์–ป์–ด๋‚ผ ์ˆ˜ ์žˆ๋Š” ํ‘œํ˜„๋“ค์„ ์••์ถ•ํ•ด์„œ ๋ชจ๋ธ์— ๋…น์—ฌ ๋„ฃ๋Š” ๊ณผ์ •์ด๋‹ค. ๋ชจ๋ธ์ด ๋†“์น˜๋Š” ๋ฐ์ดํ„ฐ๊ฐ€ ์—†๋„๋ก ๋ชจ๋“  ๋ฐ์ดํ„ฐ๋ฅผ ๋‹ค ๋„ฃ์„ ์ˆ˜ ์žˆ๋ฉด ์ข‹์ง€๋งŒ, ํ•™์Šต์— ์‚ฌ์šฉ๋˜๋Š” ๋Œ€๋ถ€๋ถ„์˜ ๋ฐ์ดํ„ฐ๊ฐ€ ํŽธํ–ฅ๋˜์–ด ์žˆ๋‹ค. ์‚ฌ๋žŒ์ด ์นด๋ฉ”๋ผ๋กœ ์ฐ์€ ์‚ฌ์ง„๋“ค์„ ํ•™์Šต์— ์‚ฌ์šฉํ•˜๋Š”๋ฐ ๋Œ€๊ฐœ ์‚ฌ์ง„์„ ์ฐ์„ ๋•Œ๋Š” ์•„๋ฆ„๋‹ต๊ฒŒ ์ฐ๊ธฐ ์œ„ํ•ด ๋ฐ์€ ์กฐ๋ช… ์•„๋ž˜์—์„œ ์ฐ๊ฑฐ๋‚˜ ํŠน์ • ๊ฐ๋„์—์„œ ์ฐ๋Š” ๋“ฑ์˜ ํŽธํ–ฅ์ด ์ผ์–ด๋‚˜๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค.

    ๊ทน๋‹จ์ ์ธ ์˜ˆ๋กœ ๊ณ ์–‘์ด์™€ ๊ฐ•์•„์ง€๋ฅผ ๋ถ„๋ฅ˜ํ•˜๋Š” ๋ชจ๋ธ์„ ๋งŒ๋“ค์—ˆ๋Š”๋ฐ, ๊ณ ์–‘์ด ์‚ฌ์ง„์€ ์ „๋ถ€ ๋ฐ์€ ๋ฐฐ๊ฒฝ์ด๊ณ  ๊ฐ•์•„์ง€ ์‚ฌ์ง„์€ ์ „๋ถ€ ์–ด๋‘์šด ๋ฐฐ๊ฒฝ์ด์—ˆ๋‹ค๋ฉด ์–ด๋‘์šด ๋ฐฐ๊ฒฝ์˜ ๊ณ ์–‘์ด ์‚ฌ์ง„์ด ์ž…๋ ฅ์œผ๋กœ ๋“ค์–ด์™”์„ ๋•Œ ๋ชจ๋ธ์€ ์ด๋ฅผ ๊ฐ•์•„์ง€๋กœ ๋ถ„๋ฅ˜ํ•  ์ˆ˜๋„ ์žˆ๋‹ค.

    ํŽธํ–ฅ๋˜์ง€ ์•Š์€ ๋ฐ์ดํ„ฐ๋งŒ์„ ์‚ฌ์šฉํ•˜๊ฑฐ๋‚˜ ๋” ๋งŽ์€ ๋ฐ์ดํ„ฐ๋ฅผ ๋ชจ์œผ๋Š” ๋ฐฉ๋ฒ•๋„ ์žˆ๊ฒ ์ง€๋งŒ, ์‹œ๊ฐ„/๊ณต๊ฐ„์  ํ•œ๊ณ„๋กœ ๋ถˆ๊ฐ€๋Šฅํ•œ ๊ฒฝ์šฐ๊ฐ€ ๋งŽ๋‹ค. ์ด๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•œ ๋ฐฉ๋ฒ•์ด data augmentation์œผ๋กœ, ํ•™์Šต์— ์‚ฌ์šฉํ•  ๋ฐ์ดํ„ฐ์— ์—ฌ๋Ÿฌ ๊ฐ€์ง€ ์กฐ์ž‘์„ ๊ฐ€ํ•ด์„œ ๋ฐ์ดํ„ฐ์˜ ์–‘์„ ๋Š˜๋ฆฌ๊ณ  ํŽธํ–ฅ์„ ์ค„์ž„์œผ๋กœ์จ ์‹ค์ œ ๋ฐ์ดํ„ฐ์™€ ํ•™์Šต์— ์‚ฌ์šฉํ•  ๋ฐ์ดํ„ฐ์˜ ๊ฐ„๊ฒฉ์„ ์ขํžˆ๋ ค๋Š” ๊ฒƒ์ด๋‹ค. data augmentation ๊ธฐ๋ฒ•์œผ๋กœ๋Š” ๋ฐ๊ธฐ ์กฐ์ ˆ, ํšŒ์ „, ๋ฐ˜์ „, ํฌ๋กญ, affine ๋ณ€ํ™˜(=shear ๋ณ€ํ™˜) ๋“ฑ์˜ ๋ฐฉ๋ฒ•์ด ์žˆ๋‹ค. ๊ทธ ๋ฐ–์— CutOut, MixUp, CutMix ๋“ฑ์˜ label smoothing ๊ธฐ๋ฒ•์„ ์‚ฌ์šฉํ•˜๊ธฐ๋„ ํ•œ๋‹ค.
    affine ๋ณ€ํ™˜ : ์„ ๊ณผ ์ , ๊ธธ์ด ๋น„์œจ, ํ‰ํ–‰ ๊ด€๊ณ„ ๋“ฑ์ด ๋ณด์กด๋˜๋Š” ๋ณ€ํ™˜

  • Transfer learning
    ํ•œ ๋ฐ์ดํ„ฐ์…‹์—์„œ ๋ฐฐ์šด ์ง€์‹์„ ๋‹ค๋ฅธ ๋ฐ์ดํ„ฐ์…‹์— ํ™œ์šฉํ•˜๋Š” ๊ธฐ์ˆ ์ด๋‹ค.

    1) Transfer knowledge
    ์–ด๋–ค ๋ฐ์ดํ„ฐ์…‹์—์„œ ํ•™์Šตํ•œ ๋ชจ๋ธ์˜ ๋งˆ์ง€๋ง‰ FC ๋ ˆ์ด์–ด(์ตœ์ข… ๋ถ„๋ฅ˜ํ•˜๋Š” ๋ถ€๋ถ„)์„ ์ž˜๋ผ๋‚ด๊ณ  ์ƒˆ๋กœ์šด ๋ฌธ์ œ์— ํ•ด๋‹นํ•˜๋Š” FC ๋ ˆ์ด์–ด๋ฅผ ๋ถ™์ธ๋‹ค. ์ด๋ฏธ ํ•™์Šต๋œ CNN ๋ ˆ์ด์–ด๋“ค์€ ๊ทธ๋Œ€๋กœ ๋‘” ์ฑ„(Freeze) ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ์…‹์—์„œ ์ƒˆ๋กœ ๋ถ™์ธ FC ๋ ˆ์ด์–ด๋งŒ์„ ํ•™์Šต์‹œํ‚จ๋‹ค. ์ด ๋ฐฉ๋ฒ•์„ ์‚ฌ์šฉํ•˜๋ฉด CNN ๋ ˆ์ด์–ด๋Š” ๊ธฐ์กด์— ํ•™์Šตํ•œ ํŒจํ„ด์„ ๊ทธ๋Œ€๋กœ ๊ฐ€์ง€๊ณ  ์žˆ๊ณ , ์ƒˆ FC ๋ ˆ์ด์–ด๋Š” ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด ํ•™์Šตํ•˜๊ฒŒ ๋œ๋‹ค. ๊ฐ€์ง€๊ณ  ์žˆ๋Š” ๋ฐ์ดํ„ฐ๊ฐ€ ์•„์ฃผ ์ ์„ ๋•Œ ์‚ฌ์šฉํ•˜๋Š” ๋ฐฉ๋ฒ•์ด๋‹ค.

    2) Fine-tuning
    ์‚ฌ์ „ ํ›ˆ๋ จ์ด ์™„๋ฃŒ๋œ ๋ชจ๋ธ์˜ CNN ๋ ˆ์ด์–ด๋Š” ๊ทธ๋Œ€๋กœ ๋‘” ์ฑ„ FC ๋ ˆ์ด์–ด๋“ค์„ ์ „๋ถ€ ์ƒˆ๋กœ์šด ๋ฌธ์ œ์— ํ•ด๋‹นํ•˜๋Š” ๊ฒƒ์œผ๋กœ ๊ต์ฒดํ•œ๋‹ค. ํ•™์Šตํ•  ๋•Œ๋Š” CNN ๋ ˆ์ด์–ด์™€ FC ๋ ˆ์ด์–ด์˜ learning rate๋ฅผ ๋‹ค๋ฅด๊ฒŒ ์ฃผ๋Š”๋ฐ, CNN ๋ ˆ์ด์–ด๊ฐ€ ๋‹ค๋ฅธ ๋ฐ์ดํ„ฐ์…‹์—์„œ ํ•™์Šตํ•œ ํ‘œํ˜„๋“ค์„ ํ•ด์น˜์ง€ ์•Š๋„๋ก ํ•™์Šต์œจ ๋‚ฎ๊ฒŒ, FC ๋ ˆ์ด์–ด๋Š” ํ•™์Šต์œจ ๋†’๊ฒŒ ์„ค์ •ํ•œ๋‹ค. 1๋ฒˆ ๋ฐฉ๋ฒ•๋ณด๋‹ค๋Š” ๋งŽ์€ ๋ฐ์ดํ„ฐ๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ๋Š” ๊ฒฝ์šฐ์— ์‚ฌ์šฉํ•œ๋‹ค.

    3) Knowledge distillation
    Teacher-student learning์ด๋ผ๊ณ ๋„ ๋ถ€๋ฅธ๋‹ค. ํฐ ๋ฐ์ดํ„ฐ์…‹์—์„œ ํ•™์Šตํ•œ ์„ ์ƒ๋‹˜ ๋ชจ๋ธ์˜ ์ง€์‹์„ ํ•™์ƒ ๋ชจ๋ธ์— ์ „๋‹ฌํ•˜๋Š” ๋ฐฉ๋ฒ•์œผ๋กœ, ๋ชจ๋ธ ์••์ถ•์—๋„ ์œ ์šฉํ•˜๊ฒŒ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค.
    ์–ด๋–ค ์ž…๋ ฅ์ด ๋“ค์–ด์˜ค๋ฉด ์‚ฌ์ „ ํ›ˆ๋ จ๋œ ์„ ์ƒ๋‹˜ ๋ชจ๋ธ๊ณผ ํ›ˆ๋ จ๋˜์ง€ ์•Š์€ ํ•™์ƒ ๋ชจ๋ธ์— ๊ฐ๊ฐ ์ง‘์–ด๋„ฃ๊ณ  ์ถœ๋ ฅ์„ ์–ป๋Š”๋‹ค. KL divergence Loss๋ฅผ ํ†ตํ•ด ๋‘ ๋ชจ๋ธ์˜ ์ถœ๋ ฅ์„ ๋น„๊ตํ•˜๊ณ  ํ•™์ƒ ๋ชจ๋ธ์— back propagation์„ ํ†ตํ•ด ์ „๋‹ฌ, ๊ฐ€์ค‘์น˜๋ฅผ ์—…๋ฐ์ดํŠธํ•œ๋‹ค. ์ด๋ฅผ ๋ฐ˜๋ณตํ•˜๋ฉด ์„ ์ƒ๋‹˜ ๋ชจ๋ธ๊ณผ ํ•™์Šต ๋ชจ๋ธ์˜ ํŒŒ๋ผ๋ฏธํ„ฐ๋“ค์ด ๋น„์Šทํ•ด์ง„๋‹ค. ์„ ์ƒ๋‹˜ ๋ชจ๋ธ์˜ ์ถœ๋ ฅ์„ ๋ฐ”ํƒ•์œผ๋กœ ํ•™์ƒ ๋ชจ๋ธ์„ ํ›ˆ๋ จ์‹œํ‚ค๊ธฐ ๋•Œ๋ฌธ์— ๋ ˆ์ด๋ธ”์„ ์‚ฌ์šฉํ•˜์ง€ ์•Š๋Š”๋‹ค.
profile
๋ฐ˜๊ฐ€์›Œ์šฉ

0๊ฐœ์˜ ๋Œ“๊ธ€