
LLM4TS 회의론을 뒤집는 재평가 논문 리뷰. cross-domain에서 LLM이 언제 도움이 되는지 토큰 단위로 정량 분석한 결과까지.

LLM 백본을 거의 얼리고 positional embedding과 output projection에만 rsLoRA 어댑터를 꽂아 0.55M 파라미터로 GPT4TS급 시계열 예측 정확도를 달성한 경량 PEFT 논문을 리뷰한다.

시계열 예측에서 LLM의 역할을 '수치 예측기'에서 '맥락 해석기'로 옮긴 KDD '26 논문. 저주파 분해(PLFM) + iTransformer residual + Qwen3-8B refiner의 3단 파이프라인. 금융·에너지 few-shot에서 MAE 40~59%

NeurIPS '25 Best Paper. SDPA 뒤 sigmoid gate 한 줄로 attention sink가 47%→5%로 사라지고 학습 안정성·long-context 외삽이 동시에 개선된다.

agent를 어떻게 훈련하는가. closed model들이 블랙박스로 묻어둔 recipe를 1.04T MoE Kimi K2가 20K synthetic tool + Verifiable Rewards Gym + Self-Critique Rubric 3단 파이프라인으로