

- Truncation-Aware Data Whitening
SVD로 Weight를 효과적으로 줄이기 위하여 input이 Whitening 상태로 만들어주게끔 Weight를 조정한 뒤, 조정된 Weight에서 SVD를 수행하여 Compressed 된 Weight 생성.
Whitening 상태는 모든 변수들이 서로 독립적이고 표준 정규분포를 따르는 상태.
변수들 간 상관관계를 제거함으로써 각 변수들이 모델에 독립적인 정보를 제공함.
모든 변수들의 분산을 1로 만들어줌으로써, 변수들이 모델에 미치는 영향력을 동일하게 만들어줌.- Layer-wise Closed-Form Update
특이값 절단 Process(Truncation-Aware Data Whitening) 를 한번에 진행하지 않고 각 층마다 순차적으로 진행함. 처음 층에서 Compressed된 Weight를 이용한 output과 본래 Weight를 이용한 output의 차이를 최소화시키는 Weight를 구함으로써, 기존 Weight에서 최소화되었을 때의 Weight으로 Update를 진행함. 해당 과정을 각 층마다 순차적으로 진행함으로써 현재 층에서 절단된 특이값으로 인해 발생하는 error가 다음 층에 누적되지 않게 되고, 이는 곧 최종 성능 저하를 보상하게 됨.



- 숄레스키 분해로 input X의 Feature들 Whitening 시키는 Matrix S를 구함
- (S^-1X)(S^-1X)^T = I 가 성립하는지 확인(검증)
- WS를 SVD하여 가장 작은 고유값 제거함으로써 W' 획득
- input이 W'를 통과하여 X'획득
- 원래 출력과 compressed 된 출력의 차이를 최소화하는 W'를 구하고, 해당 W'를 기존 LLM의 W 위에 Override하여 Update 수행
- 1~5 과정을 각 Layer마다 순차적으로 진행하여 최종 Compressed 된 LLM을 획득





