Block Pruning + LoRA Apaptor Depth Pruning이 Width Pruning과 비교하여 경쟁력이 있다는 것을 증명 작은 Batch size에서 Inference 속도 크게 개선
Summary MAG : 가중치의 절댓값을 기준으로 블록의 중요도를 평가 Taylor : 가중치가 모델 손실에 미치는 영향을 평가 PPL : 모델이 주어진 데이터셋을 얼마나 잘 예측하는지를 평가하여 블록의 중요도를 판단