
단순 지식 정보 대화에서 진정한 의미의 AI인 LLM Agent로, LLM Function Calling 기능 살펴보기

Multi-turn trajectory 시퀀스 내 각 액션 당 하나의 피드백 시그널을 제공하는 Turn-level Agent RL

전체 에이전트 시퀀스에 단일 피드백을 제공하는 Multi-Turn Agent RL

Agent Task의 Dynamic을 User Simulator로 구현해 Adaptive한 학습을 가능하게 만드는 Agent RL

ByteDance에서 공개한 Agent Tool Environment 프레임워크 "AgentGym"에, VeRL 기반 RL 기능을 추가한 Agent RL 프레임워크