๐ EfficientNet์ 2019 CVPR์ ๋ฐํ๋ MnasNet: Platform-Aware Neural Architecture Search for Mobile์ ์ ์์ธ Mingxing Tan๊ณผ Quoc V. Le๊ฐ ์ด ๋ ผ๋ฌธ์ด๋ฉฐ Image Classification ํ๊ฒ์ ์ฑ๋ฅ์ด ์ข์ Model์ธ EfficientNet์ ์ ์ํ์์ต๋๋ค.
์ด ๋ชจ๋ธ์ Image Classification Task์ ๋ํด์ ๊ธฐ์กด๋ณด๋ค ํจ์ฌ ์ ์ ํ๋ผ๋ฏธํฐ ์๋ก ๋์ฑ ์ข์ ์ฑ๋ฅ์ ๋ด์ State-Of-The-Art(SOTA = ํ์ฌ ์ต๊ณ ์์ค)๋ฅผ ๋ฌ์ฑํ ๋ชจ๋ธ์ ๋๋ค.
ํด๋น ๋ชจ๋ธ์ ๋ํ ๋ ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ๋ฐํ์ผ๋ก ์ ๋ฆฌ๋ฅผ ํด๋ณด๊ฒ ์ต๋๋ค.
์ต์ฒจ๋จ ์ ํ์ฑ์ ๋ฌ์ฑํ๋ฉด์๋ ์ด์ ๋ชจ๋ธ์ ๋นํด ๊ท๋ชจ๊ฐ ์๊ณ ๋น ๋ฅธ ์ด๋ฏธ์ง ๋ถ๋ฅ๊ฐ ๊ฐ๋ฅํ ๋ชจ๋ธ์ ๋๋ค.
AutoML๊ณผ ๋ณตํฉ ์ค์ผ์ผ๋ง(compound scaling)์ ๊ธฐ๋ฐ์ผ๋ก ๊ฐ๋ฐ๋์์ต๋๋ค.
์์ ์คํ๋ค์ ํตํด 3๊ฐ์ง scaling factor๋ฅผ ๋์์ ๊ณ ๋ คํ๋ ๊ฒ์ด ์ข๋ค๋ ๊ฒ์ ๊ฐ๋จํ๊ฒ ์ ์ฆ์ ํ์๊ณ , ์ด๋ฒ์๋ ์ต์ ์ ๋น์จ์ ์ฐพ์์ ์ค์ ๋ชจ๋ธ์ ์ ์ฉ์ ํด์ ๋ค๋ฅธ ๋ชจ๋ธ๋ค๊ณผ ์ฑ๋ฅ์ ๋น๊ตํ๋ ๊ณผ์ ์ ์ค๋ช ๋๋ฆฌ๊ฒ ์ต๋๋ค. (๊ฒฐ๊ณผ๋ ์๋ ์ฐธ๊ณ )
์ฐ์ ์ด ๋
ผ๋ฌธ์์๋ ๋ชจ๋ธ(F)๋ฅผ ๊ณ ์ ํ๊ณ depth(d), width(w), resolution(r) 3๊ฐ์ง๋ฅผ ์กฐ์ ํ๋ ๋ฐฉ๋ฒ์ ์ ์ํ๊ณ ์๋๋ฐ, ์ด ๋ ๊ณ ์ ํ๋ ๋ชจ๋ธ(F)์ ์ข์ ๋ชจ๋ธ๋ก ์ ์ ํ๋ ๊ฒ์ด ๊ต์ฅํ ์ค์ํฉ๋๋ค. ์๋ฌด๋ฆฌ scaling factor๋ฅผ ์กฐ์ ํด๋, ์ด๊ธฐ ๋ชจ๋ธ ์์ฒด์ ์ฑ๋ฅ์ด ๋ฎ๋ค๋ฉด ์๊ณ ์ฑ๋ฅ๋ ๋ฎ๊ธฐ ๋๋ฌธ์
๋๋ค.
์ด ๋
ผ๋ฌธ์์๋ MnasNet๊ณผ ๊ฑฐ์ ๋์ผํ search space ํ์์ AutoML์ ํตํด ๋ชจ๋ธ์ ํ์ํ์๊ณ , ์ด ๊ณผ์ ์ ํตํด ์ฐพ์ ์์ ๋ชจ๋ธ์ EfficientNet-B0 ์ด๋ผ ๋ถ๋ฅด๊ณ ์์ต๋๋ค.
์์ ์์์ ํ์ด๋ ์ผ๋ง๋ ๋ง์ resource๋ฅผ ์ฌ์ฉํ ์ง์ ๋ํด ์ฌ์ฉ์๊ฐ ์ ํ coefficient์ด๋ฉฐ ์ํ, ๋ฒ ํ, ๊ฐ๋ง๊ฐ small grid search ๋ฐฉ๋ฒ์ผ๋ก ์ฐพ๊ฒ๋ ๋ณ์๋ค์ ๋๋ค.
์ฐ์ depth, width, resolution์ ๊ฐ๊ฐ ์ํ, ๋ฒ ํ, ๊ฐ๋ง๋ก ๋ํ๋ด๋ฉฐ ๊ฐ๊ฐ์ ๋น์จ์ ๋ ธ๋์์ผ๋ก ๊ฐ์กฐํ ์กฐ๊ฑด์ ๋ง์กฑ์์ผ์ผ ํฉ๋๋ค. ์ด ๋ width์ resolution์ ์ ๊ณฑ์ด ๋ค์ด๊ฐ ์ด์ ๋ depth๋ 2๋ฐฐ ํค์์ฃผ๋ฉด FLOPS๋ ๋น๋กํด์ 2๋ฐฐ ์ฆ๊ฐํ์ง๋ง, width์ resolution์ ๊ฐ๋ก์ ์ธ๋ก๊ฐ ๊ฐ๊ฐ ๊ณฑํด์ง๊ธฐ ๋๋ฌธ์ ์ ๊ณฑ ๋ฐฐ ์ฆ๊ฐํฉ๋๋ค. ๊ทธ๋์ ์ ๊ณฑ์ ๊ณฑํด์ ๊ณ์ฐ์ ํ๊ณ ์์ต๋๋ค.
๊ทธ ๋ค, ์ ์ฒด ๋ชจ๋ธ์ ์ฌ์ด์ฆ๋ ์ํ, ๋ฒ ํ, ๊ฐ๋ง์ ๋๊ฐ์ ํ์ด๋งํผ ์ ๊ณฑํ์ฌ ์กฐ์ ์ ํ๊ฒ ๋ฉ๋๋ค. ๊ฒฐ๊ตญ ์ด FLOPS๋ (์ํ๋ฒ ํ^2๊ฐ๋ง^2)^ํ์ด์ ๋น๋กํฉ๋๋ค. ์ํ๋ฒ ํ^2๊ฐ๋ง^2๋ฅผ 2๋ก ์ ํ์์ผฐ์ผ๋ฏ๋ก, ์ด FLOPS๋ ๋๋ต 2^ํ์ด์ ๋น๋กํ์ฌ ์ฆ๊ฐํฉ๋๋ค.
์์์ ์ธ๊ธํ๋ฏ์ด, EfficientNet์ ์ํ, ๋ฒ ํ, ๊ฐ๋ง ๊ฐ์ ๊ฐ๋จํ grid search๋ฅผ ํตํด ๊ตฌํ๋ ๋ฐฉ์์ ์ ์ํ๊ณ ์์ผ๋ฉฐ, ์ฒ์ ๋จ๊ณ์์๋ ํ์ด๋ฅผ 1๋ก ๊ณ ์ ํ ๋ค, ํ๊ฒ ๋ฐ์ดํฐ์ ์์ ์ข์ ์ฑ๋ฅ์ ๋ณด์ด๋ ์ํ, ๋ฒ ํ, ๊ฐ๋ง ๊ฐ์ ์ฐพ์๋ ๋๋ค. ๋ณธ ๋ ผ๋ฌธ์์๋ ์ํ ๊ฐ์ 1.2, ๋ฒ ํ ๊ฐ์ 1.1, ๊ฐ๋ง ๊ฐ์ 1.15๋ฅผ ์ฌ์ฉํ์์ผ๋ฉฐ, ๋ฐฉ๊ธ ๊ตฌํ 3๊ฐ์ scaling factor๋ ๊ณ ์ ํ ๋ค ํ์ด๋ฅผ ํค์์ฃผ๋ฉฐ ๋ชจ๋ธ์ ์ฌ์ด์ฆ๋ฅผ ํค์์ฃผ๊ณ ์์ต๋๋ค.