Pruning과 Quantization을 활용해 모델 압축을 하는 Deep compression에 대해 정리한 내용입니다.
양자화에 대한 개념과 양자화 기법들에 대해 간략히 소개하는 내용입니다.
딥러닝의 경량화 기법들에 대한 소개입니다.