up-to-date-ai

1.하나의 언어 모델을 보상 모델로도 활용하는 DPO (Direct Preference Optimization)

post-thumbnail

2.추가적인 학습이나 모델이 필요하지 않은 새로운 Preference Alignment: ORPO

post-thumbnail

3.진화론적 최적화를 도입한 Sakana.ai의 모델 머징 방법론

post-thumbnail

4.긴 프롬프트를 압축하는 세 가지 버전의 LLMLingua

post-thumbnail

5.AutoGuide: LLM을 활용한 Agent에게 더 좋은 가이드라인을 제공하는 법

post-thumbnail

6.ReAct: 언어모델의 추론과 행동 능력을 결합하기

post-thumbnail

7.Nature에 실린 200개 다국어 지원 번역모델 논문 정리

post-thumbnail

8.언어모델 서빙 시 알면 좋은 개념들: Triton Inference Server, HTTP, Rest API, gRPC

post-thumbnail

9.연구의 처음부터 끝까지 모두 수행하는 자동화된 The AI Scientist

post-thumbnail