Sketch image data classification (1st ๐Ÿ…)

Batwanยท2024๋…„ 9์›” 27์ผ
3

Boostcamp-AI

๋ชฉ๋ก ๋ณด๊ธฐ
2/12
post-thumbnail

  • 2024.09.11 ~ 2024.09.26
  • ImageNet Sketch ์ด๋ฏธ์ง€ ๋ฐ์ดํ„ฐ ๋ถ„๋ฅ˜ ( project )
  • 1st Prize ๐Ÿ†
  • Naver Connect

  • Sketch์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜ ๊ฒฝ์ง„๋Œ€ํšŒ๋Š” ์ฃผ์–ด์ง„ ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•˜์—ฌ ๋ชจ๋ธ์„ ์ œ์ž‘ํ•˜๊ณ  ์–ด๋–ค ๊ฐ์ฒด๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š”์ง€ ๋ถ„๋ฅ˜

Leaderboard

Sketch ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜ ๋Œ€ํšŒ์—์„œ 0.939์˜ acc๋กœ 1๋“ฑ์„ ํ•  ์ˆ˜ ์žˆ์—ˆ๋‹ค. 1๋“ฑ์„ ํ•  ์ˆ˜ ์žˆ์—ˆ๋˜ ์ด์œ ๋Š” ์กฐ์›๊ณผ์˜ ์ง€์‹ ๊ณต์œ , ์ฃผ๊ธฐ์ ์ธ ํšŒ์˜, ๋‹ค์–‘ํ•œ ์‹œ๋„์˜€๋˜ ๊ฒƒ ๊ฐ™๋‹ค. ๊ทธ ๊ฒฐ๊ณผ ๋Œ€ํšŒ์˜ ์ˆœ์œ„ ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ๋ชฉํ‘œ์˜€๋˜ ๋‹ค์–‘ํ•œ ์ง€์‹๋„ ํ•จ์–‘ํ•  ์ˆ˜ ์žˆ์—ˆ๋‹ค. ๋˜ํ•œ ํ˜‘์—…์˜ ์ค‘์š”์„ฑ๋„ ๋Š๋‚„ ์ˆ˜ ์žˆ๋Š” ๊ธฐํšŒ์˜€๋‹ค. ์ฒ˜์Œ์€ ์—ญํ• ์„ ์ •ํ•˜์ง€ ์•Š๊ณ  ์„œ๋กœ ํ•˜๊ณ  ์‹ถ์€ ๋„์ „์„ ํ•˜๋Š” ๊ฒƒ์œผ๋กœ ์‹œ์ž‘ํ–ˆ๋‹ค. ์ด ๋Œ€ํšŒ๋ฅผ ์ค€๋น„ํ•˜๋ฉด์„œ ๊ณ„ํš์„ ์„ธ์šฐ๊ณ  ์ค€๋น„ํ–ˆ๊ณ , ๋Œ€ํšŒ์— ๋Œ€ํ•œ ๊ฐ•์˜๋„ ์ค€๋น„๋˜์–ด ์žˆ์—ˆ๊ธฐ ๋•Œ๋ฌธ์— ๊ฐ•์˜๋ฅผ ์ฐธ๊ณ ํ•˜๋ฉด์„œ ์ค€๋น„ํ–ˆ๋‹ค.

๊ณ„ํš

1. CNN ๊ธฐ๋ฐ˜ ๋ชจ๋ธ ์‹คํ—˜

  • ํ•™์Šต์ด ๋น ๋ฅธ ResNet50์œผ๋กœ ์—ฌ๋Ÿฌ๊ฐ€์ง€ ์‹œ๋„๋ฅผ ํ•˜์—ฌ ์ธ์‚ฌ์ดํŠธ ์ œ๊ณต
  1. ์ฒ˜์Œ์€ ์ „์ดํ•™์Šต์˜ ํ•„์š”์„ฑ
    ์ „์ดํ•™์Šต์„ ์‚ฌ์šฉํ–ˆ์„ ๋•Œ์™€ ์‚ฌ์šฉํ•˜์ง€ ์•Š์•˜์„ ๋•Œ๋Š” ๋ช…ํ™•ํ•˜๊ฒŒ ์ฐจ์ด๋‚ฌ๋‹ค. ํ•™์Šต ์‹œ๊ฐ„ ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ validation์˜ loss์™€ acc๋Š” ํฌ๊ฒŒ ์ฐจ์ด๋‚ฌ๊ธฐ ๋•Œ๋ฌธ์— ์ „์ดํ•™์Šต์„ ์ด์šฉํ•˜๋Š” ๊ฒƒ์ด ๋งž๋‹ค๋Š” ํŒ๋‹จ์„ ํ–ˆ๋‹ค.
  2. ํ•˜์ดํผ ํŒŒ๋ผ๋ฏธํ„ฐ ์„ค์ •
    learning rate, decay, epoch, batch_size ๋“ฑ ๋‹ค์–‘ํ•œ ์‹œ๋„๋ฅผ ์—‘์…€๋กœ ์ •๋ฆฌํ–ˆ๋‹ค. ๊ทธ ๊ฒฐ๊ณผ ๋Œ€๊ทœ๋ชจ ๋ชจ๋ธ์—์„œ ํ•˜์ดํผ ํŒŒ๋ผ๋ฏธํ„ฐ ์„ค์ •์— ์‹œ๊ฐ„์„ ์ค„์ผ ์ˆ˜ ์žˆ์—ˆ๋‹ค.
  3. ์ฆ๊ฐ• ์‹คํ—˜
    albumentations library๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์ฆ๊ฐ• ์‹คํ—˜์„ ํ–ˆ๋‹ค. ์ง€๊ธˆ๊นŒ์ง€์˜ ๊ฒฝํ—˜์œผ๋กœ ๋„ˆ๋ฌด ๋งŽ์€ ์ฆ๊ฐ•์€ ์˜คํžˆ๋ ค ์„ฑ๋Šฅ์ด ์ €ํ•˜๋˜๋Š” ๊ฒฝํ—˜์„ ํ•˜์—ฌ ํฌ๊ฒŒ ์ง„ํ–‰ํ•˜์ง€ ์•Š์•˜๋‹ค.
# ์ •๊ทœํ™”
A.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
# 50% ํ™•๋ฅ ๋กœ ์ขŒ์šฐ ๋’ค์ง‘๊ธฐ
A.HorizontalFlip(p=0.5)
# ๋ฐ๊ธฐ ๋ฐ ๋Œ€๋น„ ์กฐ์ •
A.RandomBrightnessContrast(brightness_limit=0.2, contrast_limit=0.2, p=0.5)
# ์ƒ‰์กฐ, ์ฑ„๋„, ๋ช…๋„ ์กฐ์ •
A.HueSaturationValue(hue_shift_limit=0.2, sat_shift_limit=0.2, val_shift_limit=0.2, p=0.5)

์œ„ 4๊ฐœ๋Š” ๊ณ ์ •์œผ๋กœ ํ•˜๊ณ  ์ฆ๊ฐ•์„ ์ถ”๊ฐ€ํ•˜๋ฉด์„œ ์‹คํ–‰์„ ์ง„ํ–‰ํ–ˆ๋‹ค. Sketch image๋Š” ๋ฐ๊ธฐ์™€ ๋Œ€๋น„, ์ฑ„๋„ ๋“ฑ ์˜๋ฏธ์—†๋Š” ๊ฒƒ์ด๋ผ ํŒ๋‹จํ•˜์—ฌ ์‹คํ—˜์„ ํ•ด ๋ณธ ๊ฒฐ๊ณผ ์„ฑ๋Šฅ ์ฐจ์ด๊ฐ€ ์—†๋Š” ๊ฒƒ์œผ๋กœ ํŒ๋‹จํ•˜์—ฌ ์ œ๊ฑฐํ•˜๊ธฐ๋กœ ๊ฒฐ์ •ํ–ˆ๋‹ค. VerticalFlip, ElasticTransform, GridDistortion์˜ ์ฆ๊ฐ•์„ ํ›„๋ณด๋กœ ๋‘๊ธฐ๋กœ ํ–ˆ๋‹ค.

2. Backbone ๋ชจ๋ธ ํƒ์ƒ‰ ๋ฐ ์„ ์ •

  • ๋ชจ๋ธ ํƒ์ƒ‰
    Train image๋Š” 15,021๊ฐœ
    Test image๋Š” 10,014๊ฐœ
    ๋งŽ์€ ์–‘์˜ image์ด๊ธฐ ๋•Œ๋ฌธ์— VIT์™€ ๊ฐ™์€ ๋Œ€๊ทœ๋ชจ ๋ชจ๋ธ์„ ์ฐพ๊ณ  ์žˆ๋Š” ๊ณผ์ •์—์„œ Huggingface์—์„œ ๊ธฐ๋ก๋˜์–ด ์žˆ๋Š” eva ๋ชจ๋ธ์— ๊ด€์‹ฌ์„ ๊ฐ€์ง€๊ฒŒ ๋˜์–ด ๋ชจ๋ธ์„ ํ™œ์šฉํ•ด ๋ณด์•˜๋‹ค. ๊ทธ ๊ฒฐ๊ณผ ๋†’์€ ์„ฑ๋Šฅ์„ ๋ณด์—ฌ eva ๋ชจ๋ธ์„ ๊ตฌ์ฒดํ™” ํ•˜๊ธฐ๋กœ ๊ฒฐ์ •ํ–ˆ๋‹ค.
  • CNN์—์„œ ๊ฐ€์กŒ๋˜ ์ธ์‚ฌ์ดํŠธ๋ฅผ ํ†ตํ•ด ํ•˜์ดํผ ํŒŒ๋ผ๋ฏธํ„ฐ ์„ค์ •
    eva_large ๋ชจ๋ธ์— ํ•˜์ดํผ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์„ค์ •ํ•˜๊ณ  ์ฆ๊ฐ•์„ ์ถ”๊ฐ€ํ•˜๋ฉด์„œ ์ •ํ™•๋„๋ฅผ ๊ฐœ์„ ํ•˜๊ธฐ ์œ„ํ•ด ๋…ธ๋ ฅํ–ˆ๋‹ค. eva_large๋Š” ํ•™์Šตํ•˜๋Š”๋ฐ 1 epoch ๋‹น ์•ฝ 30๋ถ„ ์ด์ƒ์˜ ์‹œ๊ฐ„์„ ํ• ์• ํ–ˆ๊ธฐ ๋•Œ๋ฌธ์— CNN์˜ ๊ฒฐ๊ณผ๋ฅผ ๊ธฐ๋กํ•˜์ง€ ์•Š์•˜๋‹ค๋ฉด ๋” ๋งŽ์€ ์‹œ๊ฐ„์„ ํ•„์š”๋กœ ํ–ˆ์„ ๊ฒƒ์ด๋‹ค. ๊ธฐ๋ก์˜ ์ค‘์š”์„ฑ์„ ์ƒ๊ธฐํ•  ์ˆ˜ ์žˆ์—ˆ๋‹ค.

3. ๊ฐ•์˜ ์ฐธ๊ณ 

๊ฐ•์˜๋ฅผ ์‹œ์ฒญํ•˜๋ฉด์„œ ํ•„์š”ํ•œ ๋‚ด์šฉ์ด ์žˆ์„ ๋•Œ์™€ ์—†์„ ๋•Œ์˜ ์ฐจ์ด๋ฅผ ๋Š๊ผˆ๋‹ค. ํ•„์š”ํ•œ ๋‚ด์šฉ์ด ์žˆ์„ ๋•Œ ๊ฐ•์˜๋ฅผ ์‹œ์ฒญํ–ˆ๊ณ  ๊ทธ ์ค‘ ๋‘ ๊ฐ€์ง€์˜ ๋„์›€์„ ์ž‘์„ฑํ•˜๊ณ ์ž ํ•œ๋‹ค.

  • ์ด๋ก ์ ์ธ ๋ถ€๋ถ„์ด ์ดํ•ด ์•ˆ ๋ ๋•Œ
    classification์„ ํ•˜๋ฉด์„œ k-fold๋ฅผ ์ ์šฉํ•˜๊ณ  ์‹ถ์—ˆ์ง€๋งŒ ์ด๋ก ์— ๋Œ€ํ•ด์„œ ๊ตฌ์ฒด์ ์œผ๋กœ ๋ฐฐ์šฐ๊ณ , ๊ธฐ๋Šฅ์„ ํ•™์Šตํ•˜๊ณ  ์‹ถ์—ˆ๋‹ค. K-fold์— ๋Œ€ํ•œ ์ง€์‹์„ ๋ฐฐ์šธ ์ˆ˜ ์žˆ์—ˆ๊ณ , ์‹ค์Šต ๊ณผ์ œ๋ฅผ ํ†ตํ•ด ๊ตฌํ˜„ ๋ฐฉ๋ฒ•๋„ ๋ฐฐ์šธ ์ˆ˜ ์žˆ์–ด ๋น ๋ฅด๊ฒŒ ์ ์šฉํ•  ์ˆ˜ ์žˆ์—ˆ๋‹ค. ๋‘ ๋ชจ๋ธ ๋ชจ๋‘ K-fold๋ฅผ ์ ์šฉํ•˜์—ฌ ์ •ํ™•๋„๊ฐ€ ๊ฐœ์„ ๋˜๋Š” ๊ฒƒ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ์—ˆ๋‹ค.
  • ๋” ์ด์ƒ ๊ฐœ์„ ์ด ๋˜์ง€ ์•Š์„ ๋•Œ
    ๋ชจ๋ธ์˜ ๊ฐœ์„ ์ด ๋” ์ด์ƒ ๋˜์ง€ ์•Š์„ ๋•Œ ๊ฐ•์˜์—์„œ ๋‹ค๋ฃจ๋Š” voting์— ๊ด€์‹ฌ์„ ๊ฐ€์กŒ๋‹ค. ์šฐ๋ฆฌ๋Š” Hard Voting๊ณผ Soft Voting์— ๊ด€์‹ฌ์„ ๊ฐ€์กŒ๊ณ , ๊ฒฝ์šฐ์˜ ์ˆ˜๋ฅผ ์กฐํ•ฉํ•˜์—ฌ Voting์„ ์ง„ํ–‰ํ–ˆ๋‹ค.

    ๊ทธ ๊ฒฐ๊ณผ ์•„๋ž˜์™€ ๊ฐ™์€ ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์™”๊ณ , ๋†’์€ ์„ฑ๋Šฅ์„ ๊ธฐ๋กํ•  ์ˆ˜ ์žˆ์—ˆ๋‹ค.

์œ„์™€ ๊ฐ™์€ ๊ณ„ํš์œผ๋กœ ์„ฑ๊ณต์ ์œผ๋กœ ํ”„๋กœ์ ํŠธ๋ฅผ ๋งˆ์น  ์ˆ˜ ์žˆ์—ˆ๊ณ , ๋‹ค์–‘ํ•œ ์ง€์‹๋„ ๋˜ํ•œ ์Šต๋“ํ•  ์ˆ˜ ์žˆ์—ˆ๋‹ค.


ํ˜‘์—…

project Timeline

ํ”„๋กœ์ ํŠธ์—์„œ ํ˜‘์—…์€ ์ •๋ง ์ค‘์š”ํ•˜๋‹ค. ์ง‘๋‹จ์ง€์„ฑ์ด๋ผ๋Š” ๋ง์ด ์žˆ๋“ฏ์ด ํ”„๋กœ์ ํŠธ์˜ ์™„์„ฑ๋„๋ฅผ ๋†’์ด๋Š” ์ ์ด ๋งค๋ ฅ์ด๋‹ค. ๋˜ํ•œ ๋ถ€์กฑํ–ˆ๋˜, ๋ชฐ๋ž๋˜ ๋‚ด์šฉ์„ ๋Œ€ํ™”ํ•˜๋ฉด์„œ ์„œ๋กœ ๋” ๊นŠ๊ฒŒ ๋ฐฐ์šธ ์ˆ˜ ์žˆ๋Š” ๊ฒƒ๋„ ๋งค๋ ฅ์ด๋ผ๊ณ  ์ƒ๊ฐํ•œ๋‹ค. ํ˜‘์—…์„ ํ†ตํ•ด ํ”„๋กœ์ ํŠธ์˜ ์™„์„ฑ๋„ ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ์ง€์‹๋„ ๋ฐฐ์šธ ์ˆ˜ ์žˆ์–ด ๋งค์šฐ ์ค‘์š”ํ•˜๊ฒŒ ์ƒ๊ฐํ•˜๋Š” ๋ถ€๋ถ„์ด๊ธฐ๋„ ํ•˜๋‹ค. ํ˜‘์—…์œผ๋กœ ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ ํŠœ๋‹, ๋ฌธ์ œ ์ •์˜ ๋ฐ ํ•ด๊ฒฐ, ์•™์ƒ๋ธ”์„ ์ง„ํ–‰ํ–ˆ๋‹ค.

ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ ํŠœ๋‹

accuracy ๊ฐœ์„ ํ•˜๊ธฐ ์œ„ํ•ด์„œ ํšŒ์˜๋ฅผ ์ง„ํ–‰ํ•˜์—ฌ ์ตœ์ ์˜ ๊ฐ’์„ ์ฐพ๊ณ ์ž ํ–ˆ๋‹ค.
1. EVA 02-large ๋ชจ๋ธ validation loss, accuracy ๋ถ„์„

  • ์ดˆ๊ธฐ ํ•™์Šต๋ฅ  0.001์€ EVA 02-large ๋ชจ๋ธ์—๊ฒŒ ๋„ˆ๋ฌด ํผ์„ ์•Œ ์ˆ˜ ์žˆ์Œ
  • ์ดˆ๊ธฐ ๋ถˆ์•ˆ์ •ํ•œ ํ•™์Šต์œผ๋กœ ์ˆ˜๋ ด๊นŒ์ง€ ์˜ค๋ž˜ ๊ฑธ๋ฆผ (epoch 30, ์ตœ์ข… ์„ฑ๋Šฅ : 0.9310)
  • ํ•™์Šต๋ฅ ์ด 0.1๋ฐฐ ์ค„์–ด๋“œ๋Š” 10 epoch ์ดํ›„์— loss๊ฐ€ ๊ฐ์†Œํ•˜๊ณ  accuracy๊ฐ€ ์ฆ๊ฐ€ํ•จ

2. Learning rate & Decay ์กฐ์ • (step size 10 โ†’ 4)

  • ํ•™์Šต๋ฅ ์ด ๋ณ€๊ฒฝ๋˜๋Š” ์‹œ์  ์ „ํ›„๋กœ loss๊ฐ€ ๋” ์•ˆ์ •์ ์œผ๋กœ ์ˆ˜๋ ด
  • Decay๋ฅผ ์กฐ์ ˆํ•จ์œผ๋กœ์จ ๋” ๋น ๋ฅด๊ณ  ์•ˆ์ •์ ์œผ๋กœ ์ˆ˜๋ ด ๊ฐ€๋Šฅ (epoch 15, ์ตœ์ข… ์„ฑ๋Šฅ : 0.9300)
  • ํ•™์Šต๋ฅ ์ด 0.1๋ฐฐ ์ค„์–ด๋“œ๋Š” 4 epoch ์ดํ›„์— loss๊ฐ€ ๊ฐ์†Œํ•˜๊ณ  accuracy๊ฐ€ ์ฆ๊ฐ€ํ•จ
  1. ๋‹ค์–‘ํ•œ ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ ๋ณ€๊ฒฝ ์„ฑ๋Šฅ ํ…Œ์ŠคํŠธ
  • Decay ์™€ Decay step size ์กฐ์ •์„ ํ†ตํ•ด ๋ชจ๋ธ์„ ๋” ๋น ๋ฅด๊ณ  ์•ˆ์ •์ ์œผ๋กœ ํ•™์Šต์‹œํ‚ฌ ์ˆ˜ ์žˆ์Œ
    โ†’ ์—ฌ๋Ÿฌ Scheduler๋ฅผ ์‚ฌ์šฉํ•˜๊ณ  Decay step size๋ฅผ ๋ณ€๊ฒฝํ•˜์—ฌ ์„ฑ๋Šฅ ํ…Œ์ŠคํŠธ
  • ์ถ”๊ฐ€์ ์œผ๋กœ Fine-tuning layers ๋ฅผ ๋ณ€๊ฒฝํ•˜์—ฌ ์„ฑ๋Šฅ ํ…Œ์ŠคํŠธ
  • ๋ฌธ์ œ๋ฅผ ์ •์˜ํ•˜๊ณ  ์ƒˆ๋กœ์šด Method ๋ฅผ ์ ์šฉํ•  ๋•Œ, Decay ์กฐ์ ˆ์„ ํ†ตํ•ด ๋ชจ๋ธ์„ ํšจ์œจ์ ์œผ๋กœ ํ•™์Šต
  • Fine tuning-layers ๊ฐ€ Linear ๋‹จ์ผ ๋ ˆ์ด์–ด์ผ ๋•Œ๋ณด๋‹ค MLP-3 : Linear-ReLU-Linear ๋ ˆ์ด์–ด์ผ ๋•Œ ์„ฑ๋Šฅ์ด ์ข‹์Œ
  • Decay ์กฐ์ ˆ์„ ํ†ตํ•ด ๋ณด๋‹ค ํšจ์œจ์ ์ด๊ณ  ์•ˆ์ •์ ์œผ๋กœ ํ•™์Šตํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฒƒ์„ ํ™•์ธ

๋ฌธ์ œ ์ •์˜ ๋ฐ ํ•ด๊ฒฐ(1)

accuracy๋Š” 0.90์ด์ƒ์œผ๋กœ ๋†’์€ ์„ฑ๋Šฅ์„ ๋ณด์˜€๋‹ค. ๋‚˜๋จธ์ง€ 0.1๋ฅผ ์ฐพ๊ธฐ ์œ„ํ•ด์„œ ์˜ˆ์ธก์— ์‹คํŒจํ•œ ์ด๋ฏธ์ง€๋ฅผ ์‹œ๊ฐํ™” ํ–ˆ๊ณ  ์ด๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด์„œ ํšŒ์˜๋ฅผ ์ง„ํ–‰ํ–ˆ๋‹ค.

  • (a) ์‚ฌ๋žŒ๋„ ๋‘ ํด๋ž˜์Šค์˜ ์ฐจ์ด๋ฅผ ๊ตฌ๋ถ„ํ•˜๊ธฐ ์–ด๋ ค์šด ์ด๋ฏธ์ง€ ์กด์žฌ
  • (b) ์ˆ˜์ง ๋ณ€ํ™˜๋œ ์ด๋ฏธ์ง€์— ์˜ˆ์ธก์— ๋Œ€ํ•œ ์ทจ์•ฝ์  ๋ฐœ๊ฒฌ

๊ฒฐ๊ณผ

์‚ฌ๋žŒ๋„ ๊ตฌ๋ถ„ํ•˜๊ธฐ ํž˜๋“  ํด๋ž˜์Šค๋ฅผ ๊ตฌ๋ถ„ํ•˜๊ธฐ ์œ„ํ•ด์„œ ๋งŽ์€ ์‹œ๊ฐ„๊ณผ ๋…ธ๋ ฅ์ด ํ•„์š”ํ•  ๊ฒƒ์œผ๋กœ ์˜ˆ์ƒํ•˜์—ฌ ์ด๋ณด๋‹จ (b)์˜ ์ˆ˜์ง์— ๋Œ€ํ•œ ์ทจ์•ฝ์ ์„ ๋ณด์•ˆํ•˜๊ธฐ๋กœํ–ˆ๋‹ค. Vertical Flip๋ฅผ ์ ์šฉํ•˜์—ฌ ์„ฑ๋Šฅ ํ–ฅ์ƒ์— ๋„์›€์„ ์ฃผ์—ˆ๋‹ค.


๋ฌธ์ œ ์ •์˜ ๋ฐ ํ•ด๊ฒฐ(2)

ํšŒ์˜ ํ•˜๋Š” ๊ณผ์ •์—์„œ Curriculum learning ๊ธฐ๋ฒ•์„ ์•Œ๊ฒŒ ๋˜์—ˆ๋‹ค. ์ˆ˜์ง๋’ค์ง‘๊ธฐ๋ฅผ ์ถ”๊ฐ€ ํ–ˆ์„ ๋•Œ ๋’ค์ง‘์ง€ ์•Š๋Š” ๋ฐ์ดํ„ฐ์— ๋ฏธ์„ธํ•˜๊ฒŒ ์˜ˆ์ธก ์‹คํŒจํ•˜๋Š” ๋“ฑ ๋ฌธ์ œ๋ฅผ ๋ณด์ด๊ณ  ์žˆ์–ด ์ด๋ฅผ ๋ณด์•ˆํ•  ์ˆ˜ ์žˆ๋‹ค๊ณ  ํŒ๋‹จํ•˜์—ฌ ์ ์šฉํ•ด ๋ณด๊ธฐ๋กœ ํ–ˆ๋‹ค. ์•„๋ž˜์˜ ๊ฐ€์„ค์„ ํ†ตํ•ด Curriculum learning ๊ธฐ๋ฒ•์„ ์ ์šฉํ•˜์—ฌ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•ด ๋ณด๊ณ ์ž ํ–ˆ๋‹ค.

  1. Sketch ์ด๋ฏธ์ง€ ๋ฐ์ดํ„ฐ ํŠน์„ฑ์— ๋”ฐ๋ฅธ ๋ฌธ์ œ ์ •์˜ ๋ฐ ๊ฐ€์„ค ์„ค์ • (1)
    ๋‹จ์ˆœํ•œ ์ •๋ณด๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ์ง€๋งŒ, ๊ฐ™์€ ํด๋ž˜์Šค๋ผ๋„ ๋‹ค์–‘ํ•œ ๋ณ€ํ˜• ๋ฐœ์ƒ ๊ฐ€๋Šฅ
    ์ดˆ๊ธฐ ํ•™์Šต ๋‹จ๊ณ„์—์„œ ์ฆ๊ฐ• ์—†์ด ๊ธฐ๋ณธ์ ์ธ ํŒจํ„ด์„ ๋จผ์ € ํ•™์Šต ํ•˜๋ฉด, ๋ชจ๋ธ์ด ๋ฐ์ดํ„ฐ์˜ ๊ธฐ๋ณธ์ ์ธ ์œค๊ณฝ์„ ๊ณผ ํŒจํ„ด์„ ํšจ๊ณผ์ ์œผ๋กœ ํŒŒ์•… ๊ฐ€๋Šฅํ•  ๊ฒƒ์ด๋‹ค.

  2. Sketch ์ด๋ฏธ์ง€ ๋ฐ์ดํ„ฐ ํŠน์„ฑ์— ๋”ฐ๋ฅธ ๋ฌธ์ œ ์ •์˜ ๋ฐ ๊ฐ€์„ค ์„ค์ • (2)
    ์ดˆ๊ธฐ ํ•™์Šต ๋‹จ๊ณ„์—์„œ ๋ณต์žกํ•œ ๋ณ€ํ˜•์ด ํฌํ•จ๋œ ๋ฐ์ดํ„ฐ๋ฅผ ํ•™์Šต ์‹œ, ๋ชจ๋ธ์ด ํŒจํ„ด์„ ์ œ๋Œ€๋กœ ํ•™์Šตํ•˜์ง€ ๋ชปํ•จ
    ์ดˆ๊ธฐ ํ•™์Šต ๋‹จ๊ณ„์—์„œ ์ฆ๊ฐ• ์—†์ด, ํ•™์Šต ์ค‘๋ฐ˜ ์ดํ›„ ๋ถ€ํ„ฐ ์ˆ˜์ง, ์ˆ˜ํ‰, ํšŒ์ „ ๋ณ€ํ™˜ ๋“ฑ์˜ ๊ฐ„๋‹จํ•œ ๋ณ€ํ™˜ ์ ์šฉ

  3. Sketch ์ด๋ฏธ์ง€ ๋ฐ์ดํ„ฐ ํŠน์„ฑ์— ๋”ฐ๋ฅธ ๋ฌธ์ œ ์ •์˜ ๋ฐ ๊ฐ€์„ค ์„ค์ • (3)
    ๋ฐ์ดํ„ฐ์˜ ๋ถˆ๊ทœ์น™์„ฑ๊ณผ ๋””ํ…Œ์ผ ๋ถ€์กฑ์œผ๋กœ ์ธํ•ด, ๋ชจ๋ธ์ด ๊ณผ์ ํ•ฉ ๋˜๊ฑฐ๋‚˜, ๋‹ค์–‘ํ•œ ๋ณ€ํ˜•์— ์ž˜ ๋Œ€์‘ํ•˜์ง€ ๋ชปํ•˜๋Š” ๊ฒƒ์œผ๋กœ ์˜ˆ์ƒ
    Elastic ๋ณ€ํ˜•, Grid Distortion ๋“ฑ ๋ณต์žกํ•œ ๋ณ€ํ˜•์„ ํ•™์Šต ํ›„๋ฐ˜๋ถ€์— ์ ์šฉํ•˜๋ฉด ๋ชจ๋ธ์ด ๊ตฌ์กฐ์  ์™œ๊ณก์ด๋‚˜ ๋‹ค์–‘ํ•œ ๋ณ€ํ˜•์—๋„ ๊ฐ•ํ•œ ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ์„ ๊ฐ–์ถœ ์ˆ˜ ์žˆ์„ ๊ฒƒ์ด๋‹ค.

Curriculum learning

  • ์ฆ๊ฐ• ์—†์ด โ†’ ๊ฐ„๋‹จํ•œ ๋ณ€ํ˜• โ†’ ๋ณต์žกํ•œ ๋ณ€ํ˜• ์ˆœ์œผ๋กœ ํ•™์Šต
  • ์ฆ๊ฐ•์ด ๋ฐ”๋€” ๋•Œ๋งˆ๋‹ค Learning rate ๋ฅผ ๋‚ฎ์ถฐ ํ•™์Šต์„ ์•ˆ์ •ํ™” ํ•จ
  1. ์ดˆ๊ธฐ ๋‹จ๊ณ„(0-5 ์—ํฌํฌ) : ์ฆ๊ฐ•X
    ์Šค์ผ€์น˜ ๋ฐ์ดํ„ฐ์˜ ๊ธฐ๋ณธ ํŒจํ„ด์„ ํ•™์Šตํ•˜๋Š” ๋ฐ ์ง‘์ค‘ํ•˜๊ธฐ ์œ„ํ•ด, ์ฆ๊ฐ• ์—†์ด ๋ชจ๋ธ์„ ํ•™์Šต
    ๋ชจ๋ธ์ด ์ฒ˜์Œ๋ถ€ํ„ฐ ๋ณต์žกํ•œ ๋ณ€ํ˜• ์—†์ด ๋ฐ์ดํ„ฐ์˜ ๋ณธ์งˆ์ ์ธ ํŠน์ง•์„ ํŒŒ์•…ํ•  ์ˆ˜ ์žˆ๋„๋ก ๋„์›€

  2. ์ค‘๊ฐ„ ๋‹จ๊ณ„(5-10 ์—ํฌํฌ) : ์ˆ˜์ง/์ˆ˜ํ‰ ๋’ค์ง‘๊ธฐ, ์ตœ๋Œ€ 10๋„ ํšŒ์ „
    ๋ชจ๋ธ์ด ๋‹ค์–‘ํ•œ ๊ตฌ๋„์— ์ ์‘ํ•  ์ˆ˜ ์žˆ๋„๋ก, ์ˆ˜์ง/์ˆ˜ํ‰ ๋’ค์ง‘๊ธฐ์™€ 10๋„ ํšŒ์ „ ๊ฐ™์€ ๊ฐ„๋‹จํ•œ ์ฆ๊ฐ•์„ ์ถ”๊ฐ€
    ์ด ๋‹จ๊ณ„์—์„œ ๋ชจ๋ธ์€ ๋‹ค์–‘ํ•œ ๊ฐ๋„์—์„œ ๋™์ผํ•œ ํด๋ž˜์Šค๋ฅผ ์ธ์‹ํ•˜๋Š” ๋ฒ•์„ ํ•™์Šต

  3. ํ›„๋ฐ˜ ๋‹จ๊ณ„(10-20 ์—ํฌํฌ) : ์ˆ˜์ง/์ˆ˜ํ‰ ๋’ค์ง‘๊ธฐ, ์ตœ๋Œ€ 15๋„ ํšŒ์ „, Elastic ๋ณ€ํ˜•, Grid Distortion
    ๋ชจ๋ธ์ด ๋ณต์žกํ•œ ๋ณ€ํ˜•์— ์ ์‘ํ•  ์ˆ˜ ์žˆ๋„๋ก Elastic ๋ณ€ํ˜•๊ณผ Grid Distortion ๊ฐ™์€ ๊ณ ๋‚œ์ด๋„์˜ ์ฆ๊ฐ•์„ ์ถ”๊ฐ€
    ๋ชจ๋ธ์ด ๊ตฌ์กฐ์  ์™œ๊ณก๊ณผ ๋ณ€ํ˜•๋œ ์ด๋ฏธ์ง€์—์„œ๋„ ํ•™์Šตํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋˜์–ด, ๋” ๋‹ค์–‘ํ•œ ์ƒํ™ฉ์—์„œ ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ์ด ํ–ฅ์ƒ


๊ฒฐ๊ณผ

  • ์ฆ๊ฐ•์ด ๋ณต์žกํ•ด์งˆ ๋•Œ๋งˆ๋‹ค, ์ •ํ™•๋„๊ฐ€ ๋–จ์–ด์ง€๊ณ  ๋‹ค์‹œ ์˜ฌ๋ผ๊ฐ€๋Š” ๊ณผ์ •์—์„œ ๋ชจ๋ธ์ด ๋ณด๋‹ค ๋ณต์žกํ•œ ํŒจํ„ด ํ•™์Šต
  • Decay๋ฅผ ์กฐ์ ˆํ•˜์—ฌ ์ฆ๊ฐ•์ด ๋ฐ”๋€Œ๋Š” 5 epoch ๋งˆ๋‹ค Learning rate๋ฅผ ๊ฐ์†Œ์‹œ์ผœ ๊ฐ‘์ž‘์Šค๋Ÿฌ์šด ๋ณ€ํ™”๋กœ๋ถ€ํ„ฐ ํ•™์Šต ์•ˆ์ •ํ™”
  • ์ตœ์ข…์ ์œผ๋กœ ๋‹จ์ผ ๋ชจ๋ธ ์ตœ๊ณ  ์„ฑ๋Šฅ ๋‹ฌ์„ฑ ( ์ตœ์ข… ์„ฑ๋Šฅ : 0.9370 )

Curriculum learning ๊ธฐ๋ฒ•์„ ์ ์šฉํ•œ ๊ฒƒ์ด ๋Œ€ํšŒ์—์„œ 1๋“ฑํ•  ์ˆ˜ ์žˆ๋˜ ๊ฒƒ ๊ฐ™๋‹ค. ์ด์ „์—๋Š” Curriculum learning ๊ธฐ๋ฒ•์„ ์•Œ์ง€ ๋ชป ํ–ˆ๊ณ , ์ด ํ”„๋กœ์ ํŠธ์—์„œ ์ƒˆ๋กœ์šด ์ง€์‹์„ ์Šต๋“ํ•  ์ˆ˜ ์žˆ์—ˆ๋‹ค. ์กฐ์›๊ณผ์˜ ์†Œํ†ต์—์„œ ๋ฌธ์ œ์— ๋‹ค๊ฐ€๊ฐ€๋Š” ๋ฐฉ๋ฒ•๊ณผ ํ•ด๊ฒฐ๋Šฅ๋ ฅ์„ ๊ธฐ๋ฅผ ์ˆ˜ ์žˆ๋˜ ๊ฒƒ ๊ฐ™๋‹ค.


๋ชจ๋ธ ์•™์ƒ๋ธ”

๋†’์€ test accuracy ๋ชจ๋ธ๋“ค์„ ๊ฐ€์ง€๊ณ  ์•™์ƒ๋ธ”์„ ํ†ตํ•ด์„œ ์ตœ์ข… ์ œ์ถœ ํŒŒ์ผ์„ ๋งŒ๋“ค๊ณ ์ž ํ–ˆ๋‹ค.

  1. Hard Voting, Soft Voting

  2. Soft-Soft

  3. Soft-Hard

  4. Hard-Hard

  5. ์•™์ƒ๋ธ” ์„ฑ๋Šฅํ‘œ

  • EVA 02-large-Linear, EVA-giant-Linear, EVA 02-large-curriculum-mlp-3 ๋ฅผ hard-hard ์•™์ƒ๋ธ”ํ•œ ๋ชจ๋ธ์ด ๊ฐ€์žฅ ์ข‹์€ ์„ฑ๋Šฅ์„ ๋ณด์˜€๋‹ค.
  • Soft-Soft, Hard,Hard ์•™์ƒ๋ธ” Method ๋ชจ๋‘ ๋น„์Šทํ•˜๊ฒŒ ์ข‹์€ ์„ฑ๋Šฅ์„ ๋ณด์˜€๋‹ค.

๊ฒฐ๋ก 

  • ์„ฑ๋Šฅ ๋†’์€ Backbone ๋ชจ๋ธ์„ ์„ค์ •ํ•˜๊ณ  ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ ํŠœ๋‹์„ ํ†ตํ•ด ์ตœ์ ํ™”
  • ์ตœ์ ํ™”๋œ ๋ชจ๋ธ์˜ ๋ฌธ์ œ์ ์„ ํŒŒ์•…ํ•˜๊ณ  ๊ฐœ์„ 
  • ์ตœ์ข…์ ์œผ๋กœ ์„ฑ๋Šฅ ์ข‹์€ ๋ชจ๋ธ๋“ค์„ ์•™์ƒ๋ธ”ํ•˜์—ฌ ์ตœ์ข… ๊ฒฐ๊ณผ ์ƒ์„ฑ
  • ์ตœ์ข… ์„ฑ๋Šฅ (0.9390) (๋ฆฌ๋”๋ณด๋“œ 1๋“ฑ)

1๋“ฑ์„ ํ•  ์ˆ˜ ์žˆ๋˜ ์ด์œ ๋Š” ๊พธ์ค€ํ•œ ํ˜‘์—…๊ณผ ์—ญํ• ๋ถ„๋‹ด์ด๋ผ๊ณ  ์ƒ๊ฐํ•œ๋‹ค. ์„œ๋กœ์˜ ์ง€์‹๊ณผ ์ข‹์•˜๋˜ ์„ฑ๊ณผ๋ฅผ ๊ณต์œ ํ•จ์œผ๋กœ์„œ ์ง€์‹๋„ ํ•จ์–‘ํ•˜๋ฉฐ, ์ข‹์€ ๊ฒฐ๊ณผ๋ฌผ์ด ํƒ„์ƒํ•  ์ˆ˜ ์žˆ๋˜ ๊ฒƒ ๊ฐ™๋‹ค. ๊พธ์ค€ํžˆ ์†Œํ†ตํ•˜๋Š” ๊ฐœ๋ฐœ๋ฅผ ์„ ํ˜ธํ•œ๋‹ค๋Š” ์ด์œ ๋ฅผ ์•Œ๊ฒ ๋‹ค. ๋งŒ์•ฝ ๊ฐœ์ธ์œผ๋กœ ํ”„๋กœ์ ํŠธ๋ฅผ ์ง„ํ–‰ํ–ˆ๋‹ค๋ฉด ์ „์ฒด์ ์œผ๋กœ ํ”„๋กœ์ ํŠธ์˜ ์™„์„ฑ๋„๋Š” ํ˜„์žฌ์™€ ๋น„๊ตํ–ˆ์„ ๋•Œ ํ˜„์ €ํ•˜๊ฒŒ ๋‚ฎ์„ ๊ฒƒ์ด๋ผ ์ƒ๊ฐํ•œ๋‹ค. ์•ž์œผ๋กœ๋„ ๊พธ์ค€ํ•œ ์†Œํ†ต์œผ๋กœ ์„ฑ์žฅํ•  ๊ฒƒ์ด๋‹ค.

๋‚ด๊ฐ€ ํ•œ ํ–‰๋™์˜ ๊ฒฐ๊ณผ๋กœ ์–ด๋–ค ์ง€์ ์„ ๋‹ฌ์„ฑํ•˜๊ณ , ์–ด๋–ค ๊นจ๋‹ฌ์Œ์„ ์–ป์—ˆ๋Š”๊ฐ€?

  • ์˜๋ฏธ์—†๋Š” ์‹œ๋„๋Š” ์—†๋‹ค๋Š” ๊ฒƒ์„ ์•Œ๊ฒŒ ๋˜์—ˆ๋‹ค. ๋ธ”๋ž™๋ฐ•์Šค๋ผ๋Š” ๋ง์ด ์žˆ๋Š” ๊ฒƒ์ฒ˜๋Ÿผ ๋‚ด๋ถ€ ๋™์ž‘ ๋ฐฉ์‹์—์„œ ๋ช…ํ™•ํ•˜๊ฒŒ ํ•ด์„ํ•  ์ˆ˜ ์—†๊ธฐ ๋•Œ๋ฌธ์— ์‚ฌ๋žŒ์˜ ์ƒ๊ฐ์œผ๋กœ๋Š” ์ด๊ฒŒ ์™œ ๋˜๋Š” ๊ฑฐ์ง€? ๋ผ๋Š” ์ƒ๊ฐ์„ ๊ฐ€์งˆ ์ˆ˜ ์žˆ์ง€๋งŒ, ๊ทธ ํ–‰๋™์ด ๋ชจ๋ธ์˜ ๊ฐœ์„ ์— ์˜ํ–ฅ์„ ์ค„ ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฒƒ์„ ๋ฐฐ์› ๋‹ค.

์ „๊ณผ ๋น„๊ตํ•˜์—ฌ ์ƒˆ๋กญ๊ฒŒ ์‹œ๋„ํ•œ ๋ณ€ํ™”๋Š” ๋ฌด์—‡์ด๊ณ , ์–ด๋–ค ํšจ๊ณผ๊ฐ€ ์žˆ์—ˆ๋Š”๊ฐ€?

  • ์ข‹์•˜๋˜ ๋ชจ๋ธ์ด ์žˆ์œผ๋ฉด ๊ทธ ๋ชจ๋ธ๋กœ ์œ ์ง€ ํ–ˆ๋‹ค. ์ด๋ฒˆ์—๋Š” ์ข‹์€ ๋ชจ๋ธ์ด ์žˆ์ง€๋งŒ ํ•™์Šต์—์„œ ๋งŽ์€ ์‹œ๊ฐ„์ด ํ•„์š”ํ•œ ๋ชจ๋ธ๋ณด๋‹จ ๋น ๋ฅด๊ฒŒ ๋งŽ์€ ์‹œ๋„๋ฅผ ํ•  ์ˆ˜ ์žˆ๋Š” ๋ชจ๋ธ์„ ์„ ํƒํ•˜์ž๋Š” ๋งˆ์Œ์œผ๋กœ Giant์—์„œ ํ•œ ๋ฒˆ ์ข‹์€ ์„ฑ์ ์„ ๋งŒ๋“ค๊ณ , Large๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜์—ฌ ๋‹ค์–‘ํ•œ ์‹œ๋„๋ฅผ ํ–ˆ๋‹ค. Giant๋ณด๋‹ค๋Š” Large๋ชจ๋ธ์€ ๊ฒฐ๊ณผ๊ฐ€ ์ข‹์ง€ ์•Š์•˜๋‹ค. ํ•˜์ง€๋งŒ ์ปค๋ฆฌํ˜๋Ÿผ์ด๋ผ๋Š” ๊ธฐ๋Šฅ์„ ์ ์šฉํ•œ Large๋Š” Giant๋ณด๋‹ค ๊ฒฐ๊ณผ๊ฐ€ ์ข‹์€ ๊ฒƒ์„ ๋ฐฐ์› ๋‹ค. ์ž˜๋ชป๋œ ํ™•์‹ ์€ ์„ฑ์žฅ์— ์ข‹์ง€ ์•Š์€ ์š”์†Œ๊ฐ€ ๋  ๊ฒƒ ๊ฐ™๋‹ค.

๋งˆ์ฃผํ•œ ํ•œ๊ณ„๋Š” ๋ฌด์—‡์ด๋ฉฐ, ์•„์‰ฌ์› ๋˜ ์ ์€ ๋ฌด์—‡์ธ๊ฐ€?

  • ์ •ํ™•๋„๊ฐ€ ๋” ์ด์ƒ ๋ฏธ์„ธํ•˜๊ฒŒ ๋ณ€ํ™”๋งŒ ์žˆ์—ˆ๋‹ค. ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ๋ชจ๋ธ ๋ณ€๊ฒฝ์ด๋‚˜ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ๋ฐ”๊ฟ”์„œ ํ…Œ์ŠคํŠธ๋ฅผ ํ•ด์•ผ ํ–ˆ๋‹ค. ํ•˜์ง€๋งŒ, ์‹œ๊ฐ„์ด ์—†์–ด์„œ ๋‹ค์–‘ํ•œ ์‹œ๋„๋ฅผ ๋ชป ํ•œ ๊ฒƒ์ด ์•„์‰ฝ๊ณ , Giant๋ชจ๋ธ์„ ์• ์ • ํ–ˆ์—ˆ๊ธฐ ๋•Œ๋ฌธ์— ์ด๋ฅผ ๋” ๋‹ค๋ค„๋ณด๊ณ  ์‹ถ์—ˆ๋Š”๋ฐ ๋ชป ํ•œ ๊ฒƒ์ด ์•„์‰ฝ๋‹ค. ๋˜ํ•œ Giant๋ชจ๋ธ์˜ npyํŒŒ์ผ์„ ๋งŒ๋“ค์ง€ ์•Š์•„์„œ soft voting์„ ํ•˜์ง€ ๋ชป ํ•œ ๊ฒƒ์ด ์•„์‰ฝ๋‹ค.

ํ•œ๊ณ„/๊ตํ›ˆ์„ ๋ฐ”ํƒ•์œผ๋กœ ์•ž์œผ๋กœ์˜ ๊ณ„ํš

  1. ์ฒด๊ณ„์ ์ธ ๊ณ„ํš์„ ์„ธ์›Œ ์‹œ๊ฐ„์ด ๋ถ€์กฑํ•˜์ง€ ์•Š๋„๋ก ์ค€๋น„ํ•˜๋Š” ๊ฒƒ
  2. ๋ชจ๋ธ์„ ํ™œ์šฉํ•˜๊ธฐ ์œ„ํ•ด์„œ ๋ชจ๋ธ์— ๋Œ€ํ•œ ๋ฐ์ดํ„ฐ(pt, npy)๋ฅผ ์‚ฌ์ „์— ์ €์žฅํ•ด์„œ ๋น ๋ฅด๊ฒŒ ํ™œ ๊ฒƒ
  3. ๊ธฐ๋ก์„ ์ œ๋Œ€๋กœ ๋ชป ํ•œ ๊ฒƒ์ด ์•„์‰ฝ๊ธฐ ๋•Œ๋ฌธ์— ์ฒ˜์Œ๋ถ€ํ„ฐ ์ •๋ฆฌํ•˜์—ฌ ๊ธฐ๋กํ•˜๊ธฐ

์ฐธ๊ณ 

profile
AI is my life

0๊ฐœ์˜ ๋Œ“๊ธ€

๊ด€๋ จ ์ฑ„์šฉ ์ •๋ณด