
- 2024.09.11 ~ 2024.09.26
- ImageNet Sketch ์ด๋ฏธ์ง ๋ฐ์ดํฐ ๋ถ๋ฅ ( project )
- 1st Prize ๐
- Naver Connect

- Sketch์ด๋ฏธ์ง ๋ถ๋ฅ ๊ฒฝ์ง๋ํ๋ ์ฃผ์ด์ง ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ์ฌ ๋ชจ๋ธ์ ์ ์ํ๊ณ ์ด๋ค ๊ฐ์ฒด๋ฅผ ๋ํ๋ด๋์ง ๋ถ๋ฅ
Leaderboard

Sketch ์ด๋ฏธ์ง ๋ถ๋ฅ ๋ํ์์ 0.939์ acc๋ก 1๋ฑ์ ํ ์ ์์๋ค. 1๋ฑ์ ํ ์ ์์๋ ์ด์ ๋ ์กฐ์๊ณผ์ ์ง์ ๊ณต์ , ์ฃผ๊ธฐ์ ์ธ ํ์, ๋ค์ํ ์๋์๋ ๊ฒ ๊ฐ๋ค. ๊ทธ ๊ฒฐ๊ณผ ๋ํ์ ์์ ๋ฟ๋ง ์๋๋ผ ๋ชฉํ์๋ ๋ค์ํ ์ง์๋ ํจ์ํ ์ ์์๋ค. ๋ํ ํ์
์ ์ค์์ฑ๋ ๋๋ ์ ์๋ ๊ธฐํ์๋ค. ์ฒ์์ ์ญํ ์ ์ ํ์ง ์๊ณ ์๋ก ํ๊ณ ์ถ์ ๋์ ์ ํ๋ ๊ฒ์ผ๋ก ์์ํ๋ค. ์ด ๋ํ๋ฅผ ์ค๋นํ๋ฉด์ ๊ณํ์ ์ธ์ฐ๊ณ ์ค๋นํ๊ณ , ๋ํ์ ๋ํ ๊ฐ์๋ ์ค๋น๋์ด ์์๊ธฐ ๋๋ฌธ์ ๊ฐ์๋ฅผ ์ฐธ๊ณ ํ๋ฉด์ ์ค๋นํ๋ค.
๊ณํ
1. CNN ๊ธฐ๋ฐ ๋ชจ๋ธ ์คํ
- ํ์ต์ด ๋น ๋ฅธ ResNet50์ผ๋ก ์ฌ๋ฌ๊ฐ์ง ์๋๋ฅผ ํ์ฌ ์ธ์ฌ์ดํธ ์ ๊ณต
- ์ฒ์์ ์ ์ดํ์ต์ ํ์์ฑ
์ ์ดํ์ต์ ์ฌ์ฉํ์ ๋์ ์ฌ์ฉํ์ง ์์์ ๋๋ ๋ช
ํํ๊ฒ ์ฐจ์ด๋ฌ๋ค. ํ์ต ์๊ฐ ๋ฟ๋ง ์๋๋ผ validation์ loss์ acc๋ ํฌ๊ฒ ์ฐจ์ด๋ฌ๊ธฐ ๋๋ฌธ์ ์ ์ดํ์ต์ ์ด์ฉํ๋ ๊ฒ์ด ๋ง๋ค๋ ํ๋จ์ ํ๋ค.
- ํ์ดํผ ํ๋ผ๋ฏธํฐ ์ค์
learning rate, decay, epoch, batch_size ๋ฑ ๋ค์ํ ์๋๋ฅผ ์์
๋ก ์ ๋ฆฌํ๋ค. ๊ทธ ๊ฒฐ๊ณผ ๋๊ท๋ชจ ๋ชจ๋ธ์์ ํ์ดํผ ํ๋ผ๋ฏธํฐ ์ค์ ์ ์๊ฐ์ ์ค์ผ ์ ์์๋ค.
- ์ฆ๊ฐ ์คํ
albumentations library๋ฅผ ์ฌ์ฉํ์ฌ ์ฆ๊ฐ ์คํ์ ํ๋ค. ์ง๊ธ๊น์ง์ ๊ฒฝํ์ผ๋ก ๋๋ฌด ๋ง์ ์ฆ๊ฐ์ ์คํ๋ ค ์ฑ๋ฅ์ด ์ ํ๋๋ ๊ฒฝํ์ ํ์ฌ ํฌ๊ฒ ์งํํ์ง ์์๋ค.
A.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
A.HorizontalFlip(p=0.5)
A.RandomBrightnessContrast(brightness_limit=0.2, contrast_limit=0.2, p=0.5)
A.HueSaturationValue(hue_shift_limit=0.2, sat_shift_limit=0.2, val_shift_limit=0.2, p=0.5)
์ 4๊ฐ๋ ๊ณ ์ ์ผ๋ก ํ๊ณ ์ฆ๊ฐ์ ์ถ๊ฐํ๋ฉด์ ์คํ์ ์งํํ๋ค. Sketch image๋ ๋ฐ๊ธฐ์ ๋๋น, ์ฑ๋ ๋ฑ ์๋ฏธ์๋ ๊ฒ์ด๋ผ ํ๋จํ์ฌ ์คํ์ ํด ๋ณธ ๊ฒฐ๊ณผ ์ฑ๋ฅ ์ฐจ์ด๊ฐ ์๋ ๊ฒ์ผ๋ก ํ๋จํ์ฌ ์ ๊ฑฐํ๊ธฐ๋ก ๊ฒฐ์ ํ๋ค. VerticalFlip, ElasticTransform, GridDistortion์ ์ฆ๊ฐ์ ํ๋ณด๋ก ๋๊ธฐ๋ก ํ๋ค.
2. Backbone ๋ชจ๋ธ ํ์ ๋ฐ ์ ์
- ๋ชจ๋ธ ํ์
Train image๋ 15,021๊ฐ
Test image๋ 10,014๊ฐ
๋ง์ ์์ image์ด๊ธฐ ๋๋ฌธ์ VIT์ ๊ฐ์ ๋๊ท๋ชจ ๋ชจ๋ธ์ ์ฐพ๊ณ ์๋ ๊ณผ์ ์์ Huggingface์์ ๊ธฐ๋ก๋์ด ์๋ eva ๋ชจ๋ธ์ ๊ด์ฌ์ ๊ฐ์ง๊ฒ ๋์ด ๋ชจ๋ธ์ ํ์ฉํด ๋ณด์๋ค. ๊ทธ ๊ฒฐ๊ณผ ๋์ ์ฑ๋ฅ์ ๋ณด์ฌ eva ๋ชจ๋ธ์ ๊ตฌ์ฒดํ ํ๊ธฐ๋ก ๊ฒฐ์ ํ๋ค.
- CNN์์ ๊ฐ์ก๋ ์ธ์ฌ์ดํธ๋ฅผ ํตํด ํ์ดํผ ํ๋ผ๋ฏธํฐ ์ค์
eva_large ๋ชจ๋ธ์ ํ์ดํผ ํ๋ผ๋ฏธํฐ๋ฅผ ์ค์ ํ๊ณ ์ฆ๊ฐ์ ์ถ๊ฐํ๋ฉด์ ์ ํ๋๋ฅผ ๊ฐ์ ํ๊ธฐ ์ํด ๋
ธ๋ ฅํ๋ค. eva_large๋ ํ์ตํ๋๋ฐ 1 epoch ๋น ์ฝ 30๋ถ ์ด์์ ์๊ฐ์ ํ ์ ํ๊ธฐ ๋๋ฌธ์ CNN์ ๊ฒฐ๊ณผ๋ฅผ ๊ธฐ๋กํ์ง ์์๋ค๋ฉด ๋ ๋ง์ ์๊ฐ์ ํ์๋ก ํ์ ๊ฒ์ด๋ค. ๊ธฐ๋ก์ ์ค์์ฑ์ ์๊ธฐํ ์ ์์๋ค.
3. ๊ฐ์ ์ฐธ๊ณ
๊ฐ์๋ฅผ ์์ฒญํ๋ฉด์ ํ์ํ ๋ด์ฉ์ด ์์ ๋์ ์์ ๋์ ์ฐจ์ด๋ฅผ ๋๊ผ๋ค. ํ์ํ ๋ด์ฉ์ด ์์ ๋ ๊ฐ์๋ฅผ ์์ฒญํ๊ณ ๊ทธ ์ค ๋ ๊ฐ์ง์ ๋์์ ์์ฑํ๊ณ ์ ํ๋ค.
- ์ด๋ก ์ ์ธ ๋ถ๋ถ์ด ์ดํด ์ ๋ ๋
classification์ ํ๋ฉด์ k-fold๋ฅผ ์ ์ฉํ๊ณ ์ถ์์ง๋ง ์ด๋ก ์ ๋ํด์ ๊ตฌ์ฒด์ ์ผ๋ก ๋ฐฐ์ฐ๊ณ , ๊ธฐ๋ฅ์ ํ์ตํ๊ณ ์ถ์๋ค. K-fold์ ๋ํ ์ง์์ ๋ฐฐ์ธ ์ ์์๊ณ , ์ค์ต ๊ณผ์ ๋ฅผ ํตํด ๊ตฌํ ๋ฐฉ๋ฒ๋ ๋ฐฐ์ธ ์ ์์ด ๋น ๋ฅด๊ฒ ์ ์ฉํ ์ ์์๋ค. ๋ ๋ชจ๋ธ ๋ชจ๋ K-fold๋ฅผ ์ ์ฉํ์ฌ ์ ํ๋๊ฐ ๊ฐ์ ๋๋ ๊ฒ์ ํ์ธํ ์ ์์๋ค.
- ๋ ์ด์ ๊ฐ์ ์ด ๋์ง ์์ ๋
๋ชจ๋ธ์ ๊ฐ์ ์ด ๋ ์ด์ ๋์ง ์์ ๋ ๊ฐ์์์ ๋ค๋ฃจ๋ voting์ ๊ด์ฌ์ ๊ฐ์ก๋ค. ์ฐ๋ฆฌ๋ Hard Voting๊ณผ Soft Voting์ ๊ด์ฌ์ ๊ฐ์ก๊ณ , ๊ฒฝ์ฐ์ ์๋ฅผ ์กฐํฉํ์ฌ Voting์ ์งํํ๋ค.

๊ทธ ๊ฒฐ๊ณผ ์๋์ ๊ฐ์ ๊ฒฐ๊ณผ๊ฐ ๋์๊ณ , ๋์ ์ฑ๋ฅ์ ๊ธฐ๋กํ ์ ์์๋ค.

์์ ๊ฐ์ ๊ณํ์ผ๋ก ์ฑ๊ณต์ ์ผ๋ก ํ๋ก์ ํธ๋ฅผ ๋ง์น ์ ์์๊ณ , ๋ค์ํ ์ง์๋ ๋ํ ์ต๋ํ ์ ์์๋ค.
ํ์
project Timeline

ํ๋ก์ ํธ์์ ํ์
์ ์ ๋ง ์ค์ํ๋ค. ์ง๋จ์ง์ฑ์ด๋ผ๋ ๋ง์ด ์๋ฏ์ด ํ๋ก์ ํธ์ ์์ฑ๋๋ฅผ ๋์ด๋ ์ ์ด ๋งค๋ ฅ์ด๋ค. ๋ํ ๋ถ์กฑํ๋, ๋ชฐ๋๋ ๋ด์ฉ์ ๋ํํ๋ฉด์ ์๋ก ๋ ๊น๊ฒ ๋ฐฐ์ธ ์ ์๋ ๊ฒ๋ ๋งค๋ ฅ์ด๋ผ๊ณ ์๊ฐํ๋ค. ํ์
์ ํตํด ํ๋ก์ ํธ์ ์์ฑ๋ ๋ฟ๋ง ์๋๋ผ ์ง์๋ ๋ฐฐ์ธ ์ ์์ด ๋งค์ฐ ์ค์ํ๊ฒ ์๊ฐํ๋ ๋ถ๋ถ์ด๊ธฐ๋ ํ๋ค. ํ์
์ผ๋ก ํ์ดํผํ๋ผ๋ฏธํฐ ํ๋, ๋ฌธ์ ์ ์ ๋ฐ ํด๊ฒฐ, ์์๋ธ์ ์งํํ๋ค.
ํ์ดํผํ๋ผ๋ฏธํฐ ํ๋
accuracy ๊ฐ์ ํ๊ธฐ ์ํด์ ํ์๋ฅผ ์งํํ์ฌ ์ต์ ์ ๊ฐ์ ์ฐพ๊ณ ์ ํ๋ค.
1. EVA 02-large ๋ชจ๋ธ validation loss, accuracy ๋ถ์

- ์ด๊ธฐ ํ์ต๋ฅ 0.001์ EVA 02-large ๋ชจ๋ธ์๊ฒ ๋๋ฌด ํผ์ ์ ์ ์์
- ์ด๊ธฐ ๋ถ์์ ํ ํ์ต์ผ๋ก ์๋ ด๊น์ง ์ค๋ ๊ฑธ๋ฆผ (epoch 30, ์ต์ข
์ฑ๋ฅ : 0.9310)
- ํ์ต๋ฅ ์ด 0.1๋ฐฐ ์ค์ด๋๋ 10 epoch ์ดํ์ loss๊ฐ ๊ฐ์ํ๊ณ accuracy๊ฐ ์ฆ๊ฐํจ
2. Learning rate & Decay ์กฐ์ (step size 10 โ 4)

- ํ์ต๋ฅ ์ด ๋ณ๊ฒฝ๋๋ ์์ ์ ํ๋ก loss๊ฐ ๋ ์์ ์ ์ผ๋ก ์๋ ด
- Decay๋ฅผ ์กฐ์ ํจ์ผ๋ก์จ ๋ ๋น ๋ฅด๊ณ ์์ ์ ์ผ๋ก ์๋ ด ๊ฐ๋ฅ (epoch 15, ์ต์ข
์ฑ๋ฅ : 0.9300)
- ํ์ต๋ฅ ์ด 0.1๋ฐฐ ์ค์ด๋๋ 4 epoch ์ดํ์ loss๊ฐ ๊ฐ์ํ๊ณ accuracy๊ฐ ์ฆ๊ฐํจ
- ๋ค์ํ ํ์ดํผํ๋ผ๋ฏธํฐ ๋ณ๊ฒฝ ์ฑ๋ฅ ํ
์คํธ
- Decay ์ Decay step size ์กฐ์ ์ ํตํด ๋ชจ๋ธ์ ๋ ๋น ๋ฅด๊ณ ์์ ์ ์ผ๋ก ํ์ต์ํฌ ์ ์์
โ ์ฌ๋ฌ Scheduler๋ฅผ ์ฌ์ฉํ๊ณ Decay step size๋ฅผ ๋ณ๊ฒฝํ์ฌ ์ฑ๋ฅ ํ
์คํธ
- ์ถ๊ฐ์ ์ผ๋ก Fine-tuning layers ๋ฅผ ๋ณ๊ฒฝํ์ฌ ์ฑ๋ฅ ํ
์คํธ

- ๋ฌธ์ ๋ฅผ ์ ์ํ๊ณ ์๋ก์ด Method ๋ฅผ ์ ์ฉํ ๋, Decay ์กฐ์ ์ ํตํด ๋ชจ๋ธ์ ํจ์จ์ ์ผ๋ก ํ์ต
- Fine tuning-layers ๊ฐ Linear ๋จ์ผ ๋ ์ด์ด์ผ ๋๋ณด๋ค MLP-3 : Linear-ReLU-Linear ๋ ์ด์ด์ผ ๋ ์ฑ๋ฅ์ด ์ข์
- Decay ์กฐ์ ์ ํตํด ๋ณด๋ค ํจ์จ์ ์ด๊ณ ์์ ์ ์ผ๋ก ํ์ตํ ์ ์๋ค๋ ๊ฒ์ ํ์ธ
๋ฌธ์ ์ ์ ๋ฐ ํด๊ฒฐ(1)
accuracy๋ 0.90์ด์์ผ๋ก ๋์ ์ฑ๋ฅ์ ๋ณด์๋ค. ๋๋จธ์ง 0.1๋ฅผ ์ฐพ๊ธฐ ์ํด์ ์์ธก์ ์คํจํ ์ด๋ฏธ์ง๋ฅผ ์๊ฐํ ํ๊ณ ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด์ ํ์๋ฅผ ์งํํ๋ค.

- (a) ์ฌ๋๋ ๋ ํด๋์ค์ ์ฐจ์ด๋ฅผ ๊ตฌ๋ถํ๊ธฐ ์ด๋ ค์ด ์ด๋ฏธ์ง ์กด์ฌ
- (b) ์์ง ๋ณํ๋ ์ด๋ฏธ์ง์ ์์ธก์ ๋ํ ์ทจ์ฝ์ ๋ฐ๊ฒฌ
๊ฒฐ๊ณผ
์ฌ๋๋ ๊ตฌ๋ถํ๊ธฐ ํ๋ ํด๋์ค๋ฅผ ๊ตฌ๋ถํ๊ธฐ ์ํด์ ๋ง์ ์๊ฐ๊ณผ ๋
ธ๋ ฅ์ด ํ์ํ ๊ฒ์ผ๋ก ์์ํ์ฌ ์ด๋ณด๋จ (b)์ ์์ง์ ๋ํ ์ทจ์ฝ์ ์ ๋ณด์ํ๊ธฐ๋กํ๋ค. Vertical Flip๋ฅผ ์ ์ฉํ์ฌ ์ฑ๋ฅ ํฅ์์ ๋์์ ์ฃผ์๋ค.

๋ฌธ์ ์ ์ ๋ฐ ํด๊ฒฐ(2)
ํ์ ํ๋ ๊ณผ์ ์์ Curriculum learning ๊ธฐ๋ฒ์ ์๊ฒ ๋์๋ค. ์์ง๋ค์ง๊ธฐ๋ฅผ ์ถ๊ฐ ํ์ ๋ ๋ค์ง์ง ์๋ ๋ฐ์ดํฐ์ ๋ฏธ์ธํ๊ฒ ์์ธก ์คํจํ๋ ๋ฑ ๋ฌธ์ ๋ฅผ ๋ณด์ด๊ณ ์์ด ์ด๋ฅผ ๋ณด์ํ ์ ์๋ค๊ณ ํ๋จํ์ฌ ์ ์ฉํด ๋ณด๊ธฐ๋ก ํ๋ค. ์๋์ ๊ฐ์ค์ ํตํด Curriculum learning ๊ธฐ๋ฒ์ ์ ์ฉํ์ฌ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํด ๋ณด๊ณ ์ ํ๋ค.
-
Sketch ์ด๋ฏธ์ง ๋ฐ์ดํฐ ํน์ฑ์ ๋ฐ๋ฅธ ๋ฌธ์ ์ ์ ๋ฐ ๊ฐ์ค ์ค์ (1)
๋จ์ํ ์ ๋ณด๋ฅผ ๊ฐ์ง๊ณ ์์ง๋ง, ๊ฐ์ ํด๋์ค๋ผ๋ ๋ค์ํ ๋ณํ ๋ฐ์ ๊ฐ๋ฅ
์ด๊ธฐ ํ์ต ๋จ๊ณ์์ ์ฆ๊ฐ ์์ด ๊ธฐ๋ณธ์ ์ธ ํจํด์ ๋จผ์ ํ์ต ํ๋ฉด, ๋ชจ๋ธ์ด ๋ฐ์ดํฐ์ ๊ธฐ๋ณธ์ ์ธ ์ค๊ณฝ์ ๊ณผ ํจํด์ ํจ๊ณผ์ ์ผ๋ก ํ์
๊ฐ๋ฅํ ๊ฒ์ด๋ค.
-
Sketch ์ด๋ฏธ์ง ๋ฐ์ดํฐ ํน์ฑ์ ๋ฐ๋ฅธ ๋ฌธ์ ์ ์ ๋ฐ ๊ฐ์ค ์ค์ (2)
์ด๊ธฐ ํ์ต ๋จ๊ณ์์ ๋ณต์กํ ๋ณํ์ด ํฌํจ๋ ๋ฐ์ดํฐ๋ฅผ ํ์ต ์, ๋ชจ๋ธ์ด ํจํด์ ์ ๋๋ก ํ์ตํ์ง ๋ชปํจ
์ด๊ธฐ ํ์ต ๋จ๊ณ์์ ์ฆ๊ฐ ์์ด, ํ์ต ์ค๋ฐ ์ดํ ๋ถํฐ ์์ง, ์ํ, ํ์ ๋ณํ ๋ฑ์ ๊ฐ๋จํ ๋ณํ ์ ์ฉ
-
Sketch ์ด๋ฏธ์ง ๋ฐ์ดํฐ ํน์ฑ์ ๋ฐ๋ฅธ ๋ฌธ์ ์ ์ ๋ฐ ๊ฐ์ค ์ค์ (3)
๋ฐ์ดํฐ์ ๋ถ๊ท์น์ฑ๊ณผ ๋ํ
์ผ ๋ถ์กฑ์ผ๋ก ์ธํด, ๋ชจ๋ธ์ด ๊ณผ์ ํฉ ๋๊ฑฐ๋, ๋ค์ํ ๋ณํ์ ์ ๋์ํ์ง ๋ชปํ๋ ๊ฒ์ผ๋ก ์์
Elastic ๋ณํ, Grid Distortion ๋ฑ ๋ณต์กํ ๋ณํ์ ํ์ต ํ๋ฐ๋ถ์ ์ ์ฉํ๋ฉด ๋ชจ๋ธ์ด ๊ตฌ์กฐ์ ์๊ณก์ด๋ ๋ค์ํ ๋ณํ์๋ ๊ฐํ ์ผ๋ฐํ ์ฑ๋ฅ์ ๊ฐ์ถ ์ ์์ ๊ฒ์ด๋ค.
Curriculum learning
- ์ฆ๊ฐ ์์ด โ ๊ฐ๋จํ ๋ณํ โ ๋ณต์กํ ๋ณํ ์์ผ๋ก ํ์ต
- ์ฆ๊ฐ์ด ๋ฐ๋ ๋๋ง๋ค Learning rate ๋ฅผ ๋ฎ์ถฐ ํ์ต์ ์์ ํ ํจ
-
์ด๊ธฐ ๋จ๊ณ(0-5 ์ํฌํฌ) : ์ฆ๊ฐX
์ค์ผ์น ๋ฐ์ดํฐ์ ๊ธฐ๋ณธ ํจํด์ ํ์ตํ๋ ๋ฐ ์ง์คํ๊ธฐ ์ํด, ์ฆ๊ฐ ์์ด ๋ชจ๋ธ์ ํ์ต
๋ชจ๋ธ์ด ์ฒ์๋ถํฐ ๋ณต์กํ ๋ณํ ์์ด ๋ฐ์ดํฐ์ ๋ณธ์ง์ ์ธ ํน์ง์ ํ์
ํ ์ ์๋๋ก ๋์

-
์ค๊ฐ ๋จ๊ณ(5-10 ์ํฌํฌ) : ์์ง/์ํ ๋ค์ง๊ธฐ, ์ต๋ 10๋ ํ์
๋ชจ๋ธ์ด ๋ค์ํ ๊ตฌ๋์ ์ ์ํ ์ ์๋๋ก, ์์ง/์ํ ๋ค์ง๊ธฐ์ 10๋ ํ์ ๊ฐ์ ๊ฐ๋จํ ์ฆ๊ฐ์ ์ถ๊ฐ
์ด ๋จ๊ณ์์ ๋ชจ๋ธ์ ๋ค์ํ ๊ฐ๋์์ ๋์ผํ ํด๋์ค๋ฅผ ์ธ์ํ๋ ๋ฒ์ ํ์ต

-
ํ๋ฐ ๋จ๊ณ(10-20 ์ํฌํฌ) : ์์ง/์ํ ๋ค์ง๊ธฐ, ์ต๋ 15๋ ํ์ , Elastic ๋ณํ, Grid Distortion
๋ชจ๋ธ์ด ๋ณต์กํ ๋ณํ์ ์ ์ํ ์ ์๋๋ก Elastic ๋ณํ๊ณผ Grid Distortion ๊ฐ์ ๊ณ ๋์ด๋์ ์ฆ๊ฐ์ ์ถ๊ฐ
๋ชจ๋ธ์ด ๊ตฌ์กฐ์ ์๊ณก๊ณผ ๋ณํ๋ ์ด๋ฏธ์ง์์๋ ํ์ตํ ์ ์๊ฒ ๋์ด, ๋ ๋ค์ํ ์ํฉ์์ ์ผ๋ฐํ ์ฑ๋ฅ์ด ํฅ์

๊ฒฐ๊ณผ

- ์ฆ๊ฐ์ด ๋ณต์กํด์ง ๋๋ง๋ค, ์ ํ๋๊ฐ ๋จ์ด์ง๊ณ ๋ค์ ์ฌ๋ผ๊ฐ๋ ๊ณผ์ ์์ ๋ชจ๋ธ์ด ๋ณด๋ค ๋ณต์กํ ํจํด ํ์ต
- Decay๋ฅผ ์กฐ์ ํ์ฌ ์ฆ๊ฐ์ด ๋ฐ๋๋ 5 epoch ๋ง๋ค Learning rate๋ฅผ ๊ฐ์์์ผ ๊ฐ์์ค๋ฌ์ด ๋ณํ๋ก๋ถํฐ ํ์ต ์์ ํ
- ์ต์ข
์ ์ผ๋ก ๋จ์ผ ๋ชจ๋ธ ์ต๊ณ ์ฑ๋ฅ ๋ฌ์ฑ ( ์ต์ข
์ฑ๋ฅ : 0.9370 )
Curriculum learning ๊ธฐ๋ฒ์ ์ ์ฉํ ๊ฒ์ด ๋ํ์์ 1๋ฑํ ์ ์๋ ๊ฒ ๊ฐ๋ค. ์ด์ ์๋ Curriculum learning ๊ธฐ๋ฒ์ ์์ง ๋ชป ํ๊ณ , ์ด ํ๋ก์ ํธ์์ ์๋ก์ด ์ง์์ ์ต๋ํ ์ ์์๋ค. ์กฐ์๊ณผ์ ์ํต์์ ๋ฌธ์ ์ ๋ค๊ฐ๊ฐ๋ ๋ฐฉ๋ฒ๊ณผ ํด๊ฒฐ๋ฅ๋ ฅ์ ๊ธฐ๋ฅผ ์ ์๋ ๊ฒ ๊ฐ๋ค.
๋ชจ๋ธ ์์๋ธ
๋์ test accuracy ๋ชจ๋ธ๋ค์ ๊ฐ์ง๊ณ ์์๋ธ์ ํตํด์ ์ต์ข
์ ์ถ ํ์ผ์ ๋ง๋ค๊ณ ์ ํ๋ค.
-
Hard Voting, Soft Voting

-
Soft-Soft

-
Soft-Hard

-
Hard-Hard

-
์์๋ธ ์ฑ๋ฅํ

- EVA 02-large-Linear, EVA-giant-Linear, EVA 02-large-curriculum-mlp-3 ๋ฅผ hard-hard ์์๋ธํ ๋ชจ๋ธ์ด ๊ฐ์ฅ ์ข์ ์ฑ๋ฅ์ ๋ณด์๋ค.
- Soft-Soft, Hard,Hard ์์๋ธ Method ๋ชจ๋ ๋น์ทํ๊ฒ ์ข์ ์ฑ๋ฅ์ ๋ณด์๋ค.
๊ฒฐ๋ก

- ์ฑ๋ฅ ๋์ Backbone ๋ชจ๋ธ์ ์ค์ ํ๊ณ ํ์ดํผํ๋ผ๋ฏธํฐ ํ๋์ ํตํด ์ต์ ํ
- ์ต์ ํ๋ ๋ชจ๋ธ์ ๋ฌธ์ ์ ์ ํ์
ํ๊ณ ๊ฐ์
- ์ต์ข
์ ์ผ๋ก ์ฑ๋ฅ ์ข์ ๋ชจ๋ธ๋ค์ ์์๋ธํ์ฌ ์ต์ข
๊ฒฐ๊ณผ ์์ฑ
- ์ต์ข
์ฑ๋ฅ (0.9390) (๋ฆฌ๋๋ณด๋ 1๋ฑ)
1๋ฑ์ ํ ์ ์๋ ์ด์ ๋ ๊พธ์คํ ํ์
๊ณผ ์ญํ ๋ถ๋ด์ด๋ผ๊ณ ์๊ฐํ๋ค. ์๋ก์ ์ง์๊ณผ ์ข์๋ ์ฑ๊ณผ๋ฅผ ๊ณต์ ํจ์ผ๋ก์ ์ง์๋ ํจ์ํ๋ฉฐ, ์ข์ ๊ฒฐ๊ณผ๋ฌผ์ด ํ์ํ ์ ์๋ ๊ฒ ๊ฐ๋ค. ๊พธ์คํ ์ํตํ๋ ๊ฐ๋ฐ๋ฅผ ์ ํธํ๋ค๋ ์ด์ ๋ฅผ ์๊ฒ ๋ค. ๋ง์ฝ ๊ฐ์ธ์ผ๋ก ํ๋ก์ ํธ๋ฅผ ์งํํ๋ค๋ฉด ์ ์ฒด์ ์ผ๋ก ํ๋ก์ ํธ์ ์์ฑ๋๋ ํ์ฌ์ ๋น๊ตํ์ ๋ ํ์ ํ๊ฒ ๋ฎ์ ๊ฒ์ด๋ผ ์๊ฐํ๋ค. ์์ผ๋ก๋ ๊พธ์คํ ์ํต์ผ๋ก ์ฑ์ฅํ ๊ฒ์ด๋ค.
๋ด๊ฐ ํ ํ๋์ ๊ฒฐ๊ณผ๋ก ์ด๋ค ์ง์ ์ ๋ฌ์ฑํ๊ณ , ์ด๋ค ๊นจ๋ฌ์์ ์ป์๋๊ฐ?
- ์๋ฏธ์๋ ์๋๋ ์๋ค๋ ๊ฒ์ ์๊ฒ ๋์๋ค. ๋ธ๋๋ฐ์ค๋ผ๋ ๋ง์ด ์๋ ๊ฒ์ฒ๋ผ ๋ด๋ถ ๋์ ๋ฐฉ์์์ ๋ช
ํํ๊ฒ ํด์ํ ์ ์๊ธฐ ๋๋ฌธ์ ์ฌ๋์ ์๊ฐ์ผ๋ก๋ ์ด๊ฒ ์ ๋๋ ๊ฑฐ์ง? ๋ผ๋ ์๊ฐ์ ๊ฐ์ง ์ ์์ง๋ง, ๊ทธ ํ๋์ด ๋ชจ๋ธ์ ๊ฐ์ ์ ์ํฅ์ ์ค ์ ์๋ค๋ ๊ฒ์ ๋ฐฐ์ ๋ค.
์ ๊ณผ ๋น๊ตํ์ฌ ์๋กญ๊ฒ ์๋ํ ๋ณํ๋ ๋ฌด์์ด๊ณ , ์ด๋ค ํจ๊ณผ๊ฐ ์์๋๊ฐ?
- ์ข์๋ ๋ชจ๋ธ์ด ์์ผ๋ฉด ๊ทธ ๋ชจ๋ธ๋ก ์ ์ง ํ๋ค. ์ด๋ฒ์๋ ์ข์ ๋ชจ๋ธ์ด ์์ง๋ง ํ์ต์์ ๋ง์ ์๊ฐ์ด ํ์ํ ๋ชจ๋ธ๋ณด๋จ ๋น ๋ฅด๊ฒ ๋ง์ ์๋๋ฅผ ํ ์ ์๋ ๋ชจ๋ธ์ ์ ํํ์๋ ๋ง์์ผ๋ก Giant์์ ํ ๋ฒ ์ข์ ์ฑ์ ์ ๋ง๋ค๊ณ , Large๋ชจ๋ธ์ ์ฌ์ฉํ์ฌ ๋ค์ํ ์๋๋ฅผ ํ๋ค. Giant๋ณด๋ค๋ Large๋ชจ๋ธ์ ๊ฒฐ๊ณผ๊ฐ ์ข์ง ์์๋ค. ํ์ง๋ง ์ปค๋ฆฌํ๋ผ์ด๋ผ๋ ๊ธฐ๋ฅ์ ์ ์ฉํ Large๋ Giant๋ณด๋ค ๊ฒฐ๊ณผ๊ฐ ์ข์ ๊ฒ์ ๋ฐฐ์ ๋ค. ์๋ชป๋ ํ์ ์ ์ฑ์ฅ์ ์ข์ง ์์ ์์๊ฐ ๋ ๊ฒ ๊ฐ๋ค.
๋ง์ฃผํ ํ๊ณ๋ ๋ฌด์์ด๋ฉฐ, ์์ฌ์ ๋ ์ ์ ๋ฌด์์ธ๊ฐ?
- ์ ํ๋๊ฐ ๋ ์ด์ ๋ฏธ์ธํ๊ฒ ๋ณํ๋ง ์์๋ค. ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด์๋ ๋ชจ๋ธ ๋ณ๊ฒฝ์ด๋ ์๊ณ ๋ฆฌ์ฆ์ ๋ฐ๊ฟ์ ํ
์คํธ๋ฅผ ํด์ผ ํ๋ค. ํ์ง๋ง, ์๊ฐ์ด ์์ด์ ๋ค์ํ ์๋๋ฅผ ๋ชป ํ ๊ฒ์ด ์์ฝ๊ณ , Giant๋ชจ๋ธ์ ์ ์ ํ์๊ธฐ ๋๋ฌธ์ ์ด๋ฅผ ๋ ๋ค๋ค๋ณด๊ณ ์ถ์๋๋ฐ ๋ชป ํ ๊ฒ์ด ์์ฝ๋ค. ๋ํ Giant๋ชจ๋ธ์ npyํ์ผ์ ๋ง๋ค์ง ์์์ soft voting์ ํ์ง ๋ชป ํ ๊ฒ์ด ์์ฝ๋ค.
ํ๊ณ/๊ตํ์ ๋ฐํ์ผ๋ก ์์ผ๋ก์ ๊ณํ
- ์ฒด๊ณ์ ์ธ ๊ณํ์ ์ธ์ ์๊ฐ์ด ๋ถ์กฑํ์ง ์๋๋ก ์ค๋นํ๋ ๊ฒ
- ๋ชจ๋ธ์ ํ์ฉํ๊ธฐ ์ํด์ ๋ชจ๋ธ์ ๋ํ ๋ฐ์ดํฐ(pt, npy)๋ฅผ ์ฌ์ ์ ์ ์ฅํด์ ๋น ๋ฅด๊ฒ ํ ๊ฒ
- ๊ธฐ๋ก์ ์ ๋๋ก ๋ชป ํ ๊ฒ์ด ์์ฝ๊ธฐ ๋๋ฌธ์ ์ฒ์๋ถํฐ ์ ๋ฆฌํ์ฌ ๊ธฐ๋กํ๊ธฐ
์ฐธ๊ณ