
분신술의 분신-Agent들은 Policy 와 Reward 설계를 어떻게 했길래 어쩌구저쩌구 >### Multi Agent와 관련된 여러가지 내용들 . 그냥 저냥 정리 끄적끄적 SB3 StableBaseline 하는 이유는?? “멀티에이전트를 학습시키기 위해서

1.LLM의 중요한 한계점1) 제한된 지식 : 개인정보라던가 회사의 내부 자료 같은건 알수가 없다. ( ex 내일 내 구글 캘린더에 어떤 약속이 잡혀있지 ? ) . 방대한 데이터를 학습했지만 독점적인 정보는 모름2) 수동적 : 능등적으로는 프롬프트 없이 작동하지 않음

최근, 인공지능 기술의 발전으로 자연어를 이용한 로봇 제어가 가능해지고 있습니다. 이번 논문에서는 "LLM (Large Language Model) 기반 UAV(Unmanned Aerial Vehicle, 무인항공기) 제어"라는 흥미로운 주제를 다룹니다.논문 제목은 다

누가 DRL을 묻거든 눈 들어 TD3 논문을 보게하라.