
Voyager은 게임 Minecraft 환경에서 LLM을 기반으로 작동하는 지속적 학습 에이전트로 인간의 개입 없이 세계를 탐험하고, 다양한 기술을 습득하여 생존한다.기존의 연구는 강화학습이나 모방학습을 사용하여 체계적인 탐험이 어렵고, 결과의 해석 가능성이 떨어지며,

이 연구는 agent가 <span style="background-color: 많은 과제들은 목표가 복잡하거나, 구체적이지 않거나, 명시하기 어렵다. 하지만 강화학습이 성공적으로 확장되어 온 사례는 주로 보상 함수가 명확하게 정의된 분야에 집중되어있었다.따라서 인

최근 멀티모달 생성 모델이 텍스트에서 이미지 또는 비디오로의 변환에서 큰 성과를 이루었으나, 텍스트에서 오디오로의 변환은 여전히 부족한 실정이다.이 이유로는 크게 두 가지로 나눌 수 있다.1\. 고품질 텍스트-오디오 데이터셋의 부족2\. 길고 연속적인 오디오 데이터를
전통적인 음악 검색 방식은 재즈, 록, 발라드 같은 미리 정해진 태그나 범주에만 의존했었는데, MuLan은 자연어로 음악을 설명하고 검색할 수 있게 해주는 모델이다. 즉, MuLan은 ‘자연어’로 된 다양한 묘사를 통해 음악을 검색하고 태깅(분류)할 수 있는 모델이다.