
원하는 이미지에 대한 설명을 텍스트로 넣으면 이미지를 만들어 주는 생성 모델: Kandinsky

파인튜닝을 하면 기존 성능을 잃어버린다고?

A Survey on Multimodal Large Language Models

BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models

LLaMA에서 LLaVA로 진화!

방탈출 게임 논문 (이미지 사용하는 척)

모델이 행동하기 전에 어떻게 행동할지 이미지로 상상하고 행동한다고??

3D 환경에서 진짜 방탈출 해보자!!

생각하는 NPC도 머지 않았다.

34개 게임 실화?

시간 차원을 공간 차원으로 확장하는 검색??