ImageNet 챌린지 이후 Deep learning model들이 크고 복잡해지고 있지만 어느 순간부터 레이어를 깊게만 쌓으면 성능 개선은 크게 이루어지지 않고 모델은 커져 속도는 느려지게 된다. 점점 빠르고 작은 모델에 대한 요구가 증가하고 있고 효율성과 정확도의 trade-off를 통해 모델 사이즈를 줄이는 것이 일반적이다.
이 문제를 개선하기 위해 모델의 깊이 이외에도 폭, 해상도 차원에서 compound 스케일링을 통해 균형을 맞추기 위한 EfficientNet이 제안되었다.
네트워크의 폭, 깊이, 해상도를 키우면 정확도가 향상되지만 더 큰 모델에 대해서는 정확도 향상 정도가 감소하기 때문에 더 나은 정확도와 효율성을 위해서는 이 요인들의 균형을 잘 맞추는 것이 중요하다. 이를 위해 제안된 방법은 다음과 같고 각 는 small grid search를 사용해 찾고 상수로 고정하였다.
Object Detection에도 Efficiency를 위해 Compound Scaling을 적용한 1 stage detector로 EfficientDet이 제안되었다.
대부분의 기존 연구들은 Neck을 사용하지만 Upsampling, 1x1 convolution을 사용해 feature maps을 resolution 구분 없이 summation하거나 backbone과 image resolution을 크게 하는 방향으로 진행되었다.
EfficientDet에서는 여러 feature map을 가중합하는 multi-scale feature fusion과 를 조절하기 위해 model scaling을 사용하는 방식을 제안해 accuracy와 efficiency를 향상시켰다.