일반적으로 모델의 정확도를 높일 때,
①network의 depth를 깊게 만드는 것
②channel width(filter 개수)를 늘리는 것(width가 넓을수록 미세한 정보가 많이 담아짐)
③input image의 해상도를 올리는 것을 조절한다.
EfficientNet은 3가지를 효율적으로 조절할 수 있는 compound scaling 방법을 사용했다. 깊이, 너비, 입력 이미지 크기가 일정한 관계가 있다는 것을 실험적으로 찾아내고, 이 관계를 수식으로 만들었다.
※ EfficientNet은 이 3가지의 최적의 조합을 AutoML을 통해 찾은 논문이다. 조합을 효율적으로 만들 수 있도록 하는 compound scaling 방법을 제안하며 이를 통해 더 작은 크기의 모델로도 SOTA를 달성한 논문이다.
w(너비), d(깊이), r(입력 해상도)에 따른 정확도 값을 나타낸 그래프이다. 그림을 보면 w, d, r이 일정값 이상이 되면 정확도 증가량이 줄어든다. w, d, r 중 하나만 조절하는 것보다 d와 r을 함께 조절하여 최고의 효율을 찾아내는 것이 Compound Scailing 이다.