
+) 헤시안 행렬을 사용하는 방법과의 차이
저장용 양자화 (Quantization for Storage)
추론용 양자화 (Quantization for Inference)
목적: 추론 속도와 메모리 효율을 높이면서 정확도 저하를 최소화
핵심 차이점:
손실 함수 변화 분석 :
잘 훈련된 모델에서는:
결론: 추론 시에는 입력 오차()에 의한 항이 지배적이므로, 가중치가 아닌 레이어 입력의 민감도를 측정해야 함
알고리즘 1

알고리즘 2

알고리즘 3

민감도 지표 (알고리즘 1, 3)
부연 설명
실험 설계
