Efficient Design Strategies for CNN

Jomii·2023년 8월 30일

Active Shift CNN CNN 경량화 Fire module Shift operation Shift-based convolution SqueezeNet fewer parameters 딥러닝 모델 경량화

Best CNN ≠ the most accurate CNN

이미지 분류를 위한 효율적인 컨볼루션 신경망(CNN) 설계는 딥러닝 모델의 성능과 효율성을 균형있게 유지하고자 하는 중요한 과제입니다. 하지만, 최고의 성능을 내는 것만이 중요한 것은 아닙니다. 효율적인 모델은 고품질의 출력을 유지하면서 작은 모델 크기, 낮은 계산 부하, 실시간 제약과 같은 다양한 측면을 고려해야 합니다.
SqueezeNet과 Shift operation은 'Efficient CNN'을 위한 다양한 설계 전략을 대표하는 좋은 예시입니다.
본 글에서는 효율적인 연산을 도입하여 CNN을 설계하는 아이디어를 제시한 주요 논문을 간략하게 정리해보려고 합니다.

💭 Best CNN ≠ the most accurate CNN

What is ‘Practivally’ best?
- high-quality output, or abundant within feature map
- small neural network size
Low computation overhead
- Snapdragon 865 GPU ~1450 Gflops
- Real-time constraint
Low battery consumption

💭 Way to Make Efficient

Improving operator design
- Depthwise-separable convolution
- Shift-based convolution
Improving architecture design
- Residual structure
- Inverted-residual structure
- Squeeze-excitation module
Applying optimization techniques
- Low-precision computation
- Pruning
- Low-rank approximation

SqueezeNet

*SqueezeNet: AlexNet-level accuracy with 50x fewer parameters and < 0.5MB model size, Iandola et al., 2016

SqueezeNet은 아키텍처와 연산자 디자인을 효율적으로 개선하여 작은 크기의 모델을 구축
ex. "Fire Module"이라 불리는 구조를 사용하여 입력 채널을 줄이고(1x1 컨볼루션으로), 동시에 다양한 특성을 학습하여 작은 모델에도 풍부한 정보를 담을 수 있게 함

특징

Replace 3x3 filters with 1x1 filters - 9X fewer parameters
Decrease the number of input channels to 3x3 filters
Downsample late in the network so that convolution layers have large activation maps
; convolution layer의 activation max pool을 뒤쪽으로 보냄 → 앞에서 줄어든 파라미터 수만큼 손실이 있을텐데 feature resolution을 키우면서 feed forwarding을 해서 더 좋은 표현력을 얻음