EfficientNet

์•ˆ์„ฑ์ธยท2022๋…„ 7์›” 7์ผ
0

๐Ÿ“– EfficientNet์€ 2019 CVPR์— ๋ฐœํ‘œ๋œ MnasNet: Platform-Aware Neural Architecture Search for Mobile์˜ ์ €์ž์ธ Mingxing Tan๊ณผ Quoc V. Le๊ฐ€ ์“ด ๋…ผ๋ฌธ์ด๋ฉฐ Image Classification ํƒ€๊ฒŸ์˜ ์„ฑ๋Šฅ์ด ์ข‹์€ Model์ธ EfficientNet์„ ์ œ์•ˆํ•˜์˜€์Šต๋‹ˆ๋‹ค.
์ด ๋ชจ๋ธ์€ Image Classification Task์— ๋Œ€ํ•ด์„œ ๊ธฐ์กด๋ณด๋‹ค ํ›จ์”ฌ ์ ์€ ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜๋กœ ๋”์šฑ ์ข‹์€ ์„ฑ๋Šฅ์„ ๋‚ด์„œ State-Of-The-Art(SOTA = ํ˜„์žฌ ์ตœ๊ณ  ์ˆ˜์ค€)๋ฅผ ๋‹ฌ์„ฑํ•œ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค.
ํ•ด๋‹น ๋ชจ๋ธ์— ๋Œ€ํ•œ ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ์ •๋ฆฌ๋ฅผ ํ•ด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.


Notion

  • ์ตœ์ฒจ๋‹จ ์ •ํ™•์„ฑ์„ ๋‹ฌ์„ฑํ•˜๋ฉด์„œ๋„ ์ด์ „ ๋ชจ๋ธ์— ๋น„ํ•ด ๊ทœ๋ชจ๊ฐ€ ์ž‘๊ณ  ๋น ๋ฅธ ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜๊ฐ€ ๊ฐ€๋Šฅํ•œ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค.

  • AutoML๊ณผ ๋ณตํ•ฉ ์Šค์ผ€์ผ๋ง(compound scaling)์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๊ฐœ๋ฐœ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

    • compound scaling์ด๋ž€, width scaling(conv filter ๊ฐœ์ˆ˜), depth scaling(layer ๊ฐœ์ˆ˜), resolution scaling(input image ํ•ด์ƒ๋„)์„ ํ˜ผํ•ฉํ•œ ์Šค์ผ€์ผ๋ง ๊ธฐ๋ฒ•์„ ๋งํ•ฉ๋‹ˆ๋‹ค.
    • ์ด์ „ ์—ฐ๊ตฌ์—์„œ๋Š” depth, width, resolution ์ค‘ ํ•˜๋‚˜๋งŒ ์Šค์ผ€์ผ๋ง์„ ํ•˜๋Š” ๊ฒƒ์„ ์ฃผ๋กœ ๋‹ค๋ค˜์œผ๋‚˜, ๋” ๋‚˜์€ ์ •ํ™•๋„์™€ ํšจ์œจ์„ฑ์œผ๋กœ ConvNet์„ scale upํ•˜๋Š” ์ •ํ˜•์ ์ธ ๋ฐฉ๋ฒ•์„ ๊ณ ์•ˆํ•œ ๊ฒฐ๊ณผ, ์‹ค์ฆ์ ์ธ ์—ฐ๊ตฌ์—์„œ depth, width, resolution ์ด 3๊ฐ€์ง€์˜ ๊ท ํ˜•์„ ์ž˜ ๋งž์ถ”๋Š” ๊ฒƒ์ด ์ค‘์š”ํ•จ์„ ๋ณด์˜€๊ธฐ์— ์ƒ์ˆ˜ ๋น„์œจ๋กœ 3๊ฐ€์ง€๋ฅผ ๊ฐ๊ฐ scalingํ•˜๋ฉด ๋œ๋‹ค๋Š” ๊ฒƒ์„ ์•Œ์•„๋‚ด์—ˆ์Šต๋‹ˆ๋‹ค.

Experiment

Compound Scaling

  • ์ผ๋ฐ˜์ ์œผ๋กœ ConvNet์˜ ์ •ํ™•๋„๋ฅผ ๋†’์ผ ๋•Œ ์ž˜ ์งœ์—ฌ์ง„ ๋ชจ๋ธ ์ž์ฒด๋ฅผ ์ฐพ๋Š” ๋ฐฉ๋ฒ•๋„ ์žˆ์ง€๋งŒ, ๊ธฐ์กด ๋ชจ๋ธ์„ ๋ฐ”ํƒ•์œผ๋กœ Complexity๋ฅผ ๋†’์ด๋Š” ๋ฐฉ๋ฒ•๋„ ๋งŽ์ด ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค.
  • ์œ„ ๊ทธ๋ฆผ์€ ์ด๋ฏธ ์กด์žฌํ•˜๋Š” ๋ชจ๋ธ์˜ size๋ฅผ ํ‚ค์›Œ์ฃผ๋Š” ์—ฌ๋Ÿฌ ๋ฐฉ๋ฒ•๋“ค์„ ๋ณด์—ฌ์ฃผ๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.
    ๋Œ€ํ‘œ์ ์œผ๋กœ filter์˜ ๊ฐœ์ˆ˜๋ฅผ(channel์˜ ๊ฐœ์ˆ˜๋ฅผ) ๋Š˜๋ฆฌ๋Š” width scaling๊ณผ layer์˜ ๊ฐœ์ˆ˜๋ฅผ ๋Š˜๋ฆฌ๋Š” depth scaling๊ณผ input image์˜ ํ•ด์ƒ๋„๋ฅผ ๋†’์ด๋Š” resolution scaling์ด ์ž์ฃผ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค.
    (e)์—์„œ ๋ณด์—ฌ์ฃผ๋Š” ๊ฒƒ์ด ๋ณตํ•ฉ ์Šค์ผ€์ผ๋ง(compound scaling)์— ํ•ด๋‹นํ•ฉ๋‹ˆ๋‹ค.
    ResNet์ด depth scaling์„ ํ†ตํ•ด ๋ชจ๋ธ์˜ ํฌ๊ธฐ๋ฅผ ์กฐ์ ˆํ•˜๋Š” ๋Œ€ํ‘œ์ ์ธ ๋ชจ๋ธ์ด๋ฉฐ(ex, ResNet-50, ResNet-101) MobileNet, ShuffleNet ๋“ฑ์ด width scaling์„ ํ†ตํ•ด ๋ชจ๋ธ์˜ ํฌ๊ธฐ๋ฅผ ์กฐ์ ˆํ•˜๋Š” ๋Œ€ํ‘œ์ ์ธ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. (ex, MobileNet-224 1.0, MobileNet-224 0.5)
    ํ•˜์ง€๋งŒ ๊ธฐ์กด ๋ฐฉ์‹๋“ค์—์„œ๋Š” ์œ„์˜ 3๊ฐ€์ง€ scaling์„ ๋™์‹œ์— ๊ณ ๋ คํ•˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ๊ฑฐ์˜ ์—†์—ˆ์Šต๋‹ˆ๋‹ค.

  • ๋˜ํ•œ 3๊ฐ€์ง€ scaling ๊ธฐ๋ฒ• ์ค‘์— ์–ด๋–ค ๊ธฐ๋ฒ•์„ ์‚ฌ์šฉํ• ์ง€์— ๋Œ€ํ•ด์„œ๋„ ๋งˆ๋•…ํ•œ ๊ฐ€์ด๋“œ๋ผ์ธ์ด ์กด์žฌํ•˜์ง€ ์•Š๊ณ , ์‹ค์ œ๋กœ ๋ฌด์ž‘์ • ํ‚ค์šด๋‹ค๊ณ  ์ •ํ™•๋„๊ฐ€ ๊ณ„์† ์˜ค๋ฅด๋Š” ๊ฒƒ๋„ ์•„๋‹ˆ๋ผ ์ผ์ผ์ด ์‹คํ—˜์„ ํ•ด๋ด์•ผํ•˜๋Š” ์–ด๋ ค์›€๋„ ์กด์žฌํ•˜์˜€์Šต๋‹ˆ๋‹ค.
    ๋ณธ ๋…ผ๋ฌธ์—์„œ๋Š” ์‹ค์ œ๋กœ 3๊ฐ€์ง€ scaling ๊ธฐ๋ฒ•์— ๋Œ€ํ•ด ๊ฐ scaling ๊ธฐ๋ฒ•๋งˆ๋‹ค ๋‚˜๋จธ์ง€๋Š” ๊ณ ์ •ํ•ด๋‘๊ณ  1๊ฐœ์˜ scaling factor๋งŒ ํ‚ค์›Œ๊ฐ€๋ฉฐ ์ •ํ™•๋„์˜ ๋ณ€ํ™”๋ฅผ ์ธก์ •ํ•˜์˜€์Šต๋‹ˆ๋‹ค.
  • ์œ„ ๊ทธ๋ฆผ์—์„œ๋Š” width ํฌ๊ธฐ๋ฅผ 5๋ฐฐ๋กœ ์˜ฌ๋ ธ์„ ๋•Œ ์„ฑ๋Šฅ ๊ฐœ์„ ์˜ ๋ณ€ํ™”๊ฐ€ ๋œ ํ•˜๊ณ , depth ํฌ๊ธฐ๋ฅผ 8๋ฐฐ ์˜ฌ๋ ธ์„ ๋•Œ ์ด์ „๋ณด๋‹ค ์„ฑ๋Šฅ์ด ๋” ์ด์ƒ ์˜ฌ๋ผ๊ฐ€์ง€ ์•Š์œผ๋ฉฐ, ๊ทธ๋‚˜๋งˆ resolution scaling์ด ํ‚ค์šฐ๋ฉด ํ‚ค์šธ์ˆ˜๋ก ์ •ํ™•๋„๊ฐ€ ์ž˜ ์˜ค๋ฅด๋Š” ๊ฒƒ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

  • ๋น„์Šทํ•œ ๋ฐฉ์‹์œผ๋กœ ์ด๋ฒˆ์—” depth(d)์™€ resolution(r)์„ ๊ณ ์ •ํ•ด๋‘๊ณ  width๋งŒ ์กฐ์ ˆํ•˜๋ฉฐ ์ •ํ™•๋„์˜ ๋ณ€ํ™”๋ฅผ ์ธก์ •ํ•˜๋Š” ์‹คํ—˜์„ ์ˆ˜ํ–‰ํ•˜์˜€์Šต๋‹ˆ๋‹ค.
  • ๊ฐ™์€ FLOPS ์ž„์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ํฌ๊ฒŒ๋Š” 1.5% ๊นŒ์ง€ ์ •ํ™•๋„๊ฐ€ ์ฐจ์ด๊ฐ€ ๋‚  ์ˆ˜ ์žˆ์Œ์„ ์‹œ์‚ฌํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์ดˆ๋ก์ƒ‰ ์„ (d = 2.0, r = 1.0)๊ณผ ๋…ธ๋ž€์ƒ‰ ์„ (d = 1.0, r = 1.3)์„ ๋น„๊ตํ•˜๋ฉด depth๋ฅผ ํ‚ค์šฐ๋Š” ๊ฒƒ ๋ณด๋‹ค๋Š” resolution์„ ํ‚ค์šฐ๋Š” ๊ฒƒ์ด ์ •ํ™•๋„๊ฐ€ ์ข‹์Œ์„ ์•Œ ์ˆ˜ ์žˆ๊ณ , ๋นจ๊ฐ„์ƒ‰ ์„ (d = 2.0, r = 1.3)์„ ๋ณด๋ฉด 1๊ฐ€์ง€, ํ˜น์€ 2๊ฐ€์ง€ scaling factor๋งŒ ํ‚ค์›Œ์ฃผ๋Š” ๊ฒƒ ๋ณด๋‹ค 3๊ฐ€์ง€ scaling factor๋ฅผ ๋™์‹œ์— ํ‚ค์›Œ์ฃผ๋Š” ๊ฒƒ์ด ๊ฐ€์žฅ ์„ฑ๋Šฅ์ด ์ข‹์Œ์„ ์‹คํ—˜์ ์œผ๋กœ ๋ณด์—ฌ์ฃผ๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

  • ์œ„์˜ ์‹คํ—˜๋“ค์„ ํ†ตํ•ด 3๊ฐ€์ง€ scaling factor๋ฅผ ๋™์‹œ์— ๊ณ ๋ คํ•˜๋Š” ๊ฒƒ์ด ์ข‹๋‹ค๋Š” ๊ฒƒ์„ ๊ฐ„๋‹จํ•˜๊ฒŒ ์ž…์ฆ์„ ํ•˜์˜€๊ณ , ์ด๋ฒˆ์—๋Š” ์ตœ์ ์˜ ๋น„์œจ์„ ์ฐพ์•„์„œ ์‹ค์ œ ๋ชจ๋ธ์— ์ ์šฉ์„ ํ•ด์„œ ๋‹ค๋ฅธ ๋ชจ๋ธ๋“ค๊ณผ ์„ฑ๋Šฅ์„ ๋น„๊ตํ•˜๋Š” ๊ณผ์ •์„ ์„ค๋ช… ๋“œ๋ฆฌ๊ฒ ์Šต๋‹ˆ๋‹ค. (๊ฒฐ๊ณผ๋Š” ์•„๋ž˜ ์ฐธ๊ณ )

  • ์šฐ์„  ์ด ๋…ผ๋ฌธ์—์„œ๋Š” ๋ชจ๋ธ(F)๋ฅผ ๊ณ ์ •ํ•˜๊ณ  depth(d), width(w), resolution(r) 3๊ฐ€์ง€๋ฅผ ์กฐ์ ˆํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์ œ์•ˆํ•˜๊ณ  ์žˆ๋Š”๋ฐ, ์ด ๋•Œ ๊ณ ์ •ํ•˜๋Š” ๋ชจ๋ธ(F)์„ ์ข‹์€ ๋ชจ๋ธ๋กœ ์„ ์ •ํ•˜๋Š” ๊ฒƒ์ด ๊ต‰์žฅํžˆ ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค. ์•„๋ฌด๋ฆฌ scaling factor๋ฅผ ์กฐ์ ˆํ•ด๋„, ์ดˆ๊ธฐ ๋ชจ๋ธ ์ž์ฒด์˜ ์„ฑ๋Šฅ์ด ๋‚ฎ๋‹ค๋ฉด ์ž„๊ณ„ ์„ฑ๋Šฅ๋„ ๋‚ฎ๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค.
    ์ด ๋…ผ๋ฌธ์—์„œ๋Š” MnasNet๊ณผ ๊ฑฐ์˜ ๋™์ผํ•œ search space ํ•˜์—์„œ AutoML์„ ํ†ตํ•ด ๋ชจ๋ธ์„ ํƒ์ƒ‰ํ•˜์˜€๊ณ , ์ด ๊ณผ์ •์„ ํ†ตํ•ด ์ฐพ์€ ์ž‘์€ ๋ชจ๋ธ์„ EfficientNet-B0 ์ด๋ผ ๋ถ€๋ฅด๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

  • ๋ชจ๋ธ ๊ตฌ์กฐ๋Š” MnasNet(๋ชจ๋ฐ”์ผ์— ์ตœ์ ํ™”๋œ ๋„คํŠธ์›Œํฌ๋ฅผ ์ฐพ์•„์ฃผ๋Š” ๋ชจ๋ธ)๊ณผ ๊ฑฐ์˜ ์œ ์‚ฌํ•˜๋ฉฐ ์œ„์˜ ํ‘œ์™€ ๊ฐ™์€ ๊ตฌ์กฐ๋กœ ๊ตฌ์„ฑ์ด ๋˜์–ด์žˆ์Šต๋‹ˆ๋‹ค. ์ด์ œ compound coefficient๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ network์˜ width, depth, resolution์„ ๊ท ๋“ฑํ•˜๊ฒŒ ์กฐ์ •ํ•˜๋Š” Compound Scaling์„ ์ ์šฉํ•˜์—ฌ ์‹คํ—˜์„ ์ˆ˜ํ–‰ํ•ฉ๋‹ˆ๋‹ค.
  • ์œ„์˜ ์‹์—์„œ ํŒŒ์ด๋Š” ์–ผ๋งˆ๋‚˜ ๋งŽ์€ resource๋ฅผ ์‚ฌ์šฉํ• ์ง€์— ๋Œ€ํ•ด ์‚ฌ์šฉ์ž๊ฐ€ ์ •ํ•  coefficient์ด๋ฉฐ ์•ŒํŒŒ, ๋ฒ ํƒ€, ๊ฐ๋งˆ๊ฐ€ small grid search ๋ฐฉ๋ฒ•์œผ๋กœ ์ฐพ๊ฒŒ๋  ๋ณ€์ˆ˜๋“ค์ž…๋‹ˆ๋‹ค.

  • ์šฐ์„  depth, width, resolution์„ ๊ฐ๊ฐ ์•ŒํŒŒ, ๋ฒ ํƒ€, ๊ฐ๋งˆ๋กœ ๋‚˜ํƒ€๋‚ด๋ฉฐ ๊ฐ๊ฐ์˜ ๋น„์œจ์€ ๋…ธ๋ž€์ƒ‰์œผ๋กœ ๊ฐ•์กฐํ•œ ์กฐ๊ฑด์„ ๋งŒ์กฑ์‹œ์ผœ์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์ด ๋•Œ width์™€ resolution์— ์ œ๊ณฑ์ด ๋“ค์–ด๊ฐ„ ์ด์œ ๋Š” depth๋Š” 2๋ฐฐ ํ‚ค์›Œ์ฃผ๋ฉด FLOPS๋„ ๋น„๋ก€ํ•ด์„œ 2๋ฐฐ ์ฆ๊ฐ€ํ•˜์ง€๋งŒ, width์™€ resolution์€ ๊ฐ€๋กœ์™€ ์„ธ๋กœ๊ฐ€ ๊ฐ๊ฐ ๊ณฑํ•ด์ง€๊ธฐ ๋•Œ๋ฌธ์— ์ œ๊ณฑ ๋ฐฐ ์ฆ๊ฐ€ํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋ž˜์„œ ์ œ๊ณฑ์„ ๊ณฑํ•ด์„œ ๊ณ„์‚ฐ์„ ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

  • ๊ทธ ๋’ค, ์ „์ฒด ๋ชจ๋ธ์˜ ์‚ฌ์ด์ฆˆ๋Š” ์•ŒํŒŒ, ๋ฒ ํƒ€, ๊ฐ๋งˆ์— ๋˜‘๊ฐ™์€ ํŒŒ์ด๋งŒํผ ์ œ๊ณฑํ•˜์—ฌ ์กฐ์ ˆ์„ ํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค. ๊ฒฐ๊ตญ ์ด FLOPS๋Š” (์•ŒํŒŒ๋ฒ ํƒ€^2๊ฐ๋งˆ^2)^ํŒŒ์ด์™€ ๋น„๋ก€ํ•ฉ๋‹ˆ๋‹ค. ์•ŒํŒŒ๋ฒ ํƒ€^2๊ฐ๋งˆ^2๋ฅผ 2๋กœ ์ œํ•œ์‹œ์ผฐ์œผ๋ฏ€๋กœ, ์ด FLOPS๋Š” ๋Œ€๋žต 2^ํŒŒ์ด์— ๋น„๋ก€ํ•˜์—ฌ ์ฆ๊ฐํ•ฉ๋‹ˆ๋‹ค.

  • ์œ„์—์„œ ์–ธ๊ธ‰ํ–ˆ๋“ฏ์ด, EfficientNet์˜ ์•ŒํŒŒ, ๋ฒ ํƒ€, ๊ฐ๋งˆ ๊ฐ’์€ ๊ฐ„๋‹จํ•œ grid search๋ฅผ ํ†ตํ•ด ๊ตฌํ•˜๋Š” ๋ฐฉ์‹์„ ์ œ์•ˆํ•˜๊ณ  ์žˆ์œผ๋ฉฐ, ์ฒ˜์Œ ๋‹จ๊ณ„์—์„œ๋Š” ํŒŒ์ด๋ฅผ 1๋กœ ๊ณ ์ •ํ•œ ๋’ค, ํƒ€๊ฒŸ ๋ฐ์ดํ„ฐ์…‹์—์„œ ์ข‹์€ ์„ฑ๋Šฅ์„ ๋ณด์ด๋Š” ์•ŒํŒŒ, ๋ฒ ํƒ€, ๊ฐ๋งˆ ๊ฐ’์„ ์ฐพ์•„๋ƒ…๋‹ˆ๋‹ค. ๋ณธ ๋…ผ๋ฌธ์—์„œ๋Š” ์•ŒํŒŒ ๊ฐ’์€ 1.2, ๋ฒ ํƒ€ ๊ฐ’์€ 1.1, ๊ฐ๋งˆ ๊ฐ’์€ 1.15๋ฅผ ์‚ฌ์šฉํ•˜์˜€์œผ๋ฉฐ, ๋ฐฉ๊ธˆ ๊ตฌํ•œ 3๊ฐœ์˜ scaling factor๋Š” ๊ณ ์ •ํ•œ ๋’ค ํŒŒ์ด๋ฅผ ํ‚ค์›Œ์ฃผ๋ฉฐ ๋ชจ๋ธ์˜ ์‚ฌ์ด์ฆˆ๋ฅผ ํ‚ค์›Œ์ฃผ๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.


Model comparison result

  • B0~B7์€ ๋ชจ๋ธ ์‚ฌ์ด์ฆˆ๋ฅผ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค.
  • ๊ฒฐ๊ณผ๋ฅผ ๋ณด์‹œ๋ฉด ๊ธฐ์กด ConvNet๋“ค์— ๋น„ํ•ด ๋น„์Šทํ•œ ์ •ํ™•๋„๋ฅผ ๋ณด์ด๋ฉด์„œ ๋™์‹œ์— parameter ์ˆ˜์™€ FLOPS ์ˆ˜๋ฅผ ๊ต‰์žฅํžˆ ๋งŽ์ด ์ ˆ์•ฝํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • ๋˜ํ•œ, ๊ธฐ์กด์— ImageNet ๋ฐ์ดํ„ฐ์…‹์—์„œ ๊ฐ€์žฅ ๋†’์€ ์ •ํ™•๋„๋ฅผ ๋‹ฌ์„ฑํ–ˆ๋˜ GPipe๋ณด๋‹ค ๋” ๋†’์€ ์ •ํ™•๋„๋ฅผ ๋‹ฌ์„ฑํ•˜๋Š” ๊ฒƒ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์‹คํ—˜๊ฒฐ๊ณผ๊ฐ€ ๊ต‰์žฅํžˆ ์ข‹์€ ๊ฒƒ์„ ๋ฐ”๋กœ ์•Œ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

  • ๋งˆ์ง€๋ง‰์œผ๋กœ ๋ชจ๋ธ์ด ์ด๋ฏธ์ง€๋ฅผ ๋ถ„๋ฅ˜ํ•  ๋•Œ ์ด๋ฏธ์ง€์˜ ์–ด๋Š ์˜์—ญ์— ์ง‘์ค‘ํ–ˆ๋Š”์ง€ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋Š” Class Activation Map(CAM)์„ ๋„์ถœํ•œ ๊ฒฐ๊ณผ, 3๊ฐœ์˜ scaling factor๋ฅผ ๊ฐ๊ฐ ๊ณ ๋ คํ•  ๋•Œ ๋ณด๋‹ค ๋™์‹œ์— ๊ณ ๋ คํ•˜์˜€์„ ๋•Œ ๋” ์ •๊ตํ•œ CAM์„ ์–ป์„ ์ˆ˜ ์žˆ๋‹ค๋ผ๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
profile
ํ•จ๊ป˜ ๊ณต๋ถ€ํ•ด์š”!

0๊ฐœ์˜ ๋Œ“๊ธ€