










자기 지도 학습 (Self-supervised learning): 레이블이 없는 방대한 데이터를 활용해 모델 스스로 데이터의 표현(representation)을 학습하는 패러다임입니다. 이는 최근 컴퓨터 비전 분야의 핵심적인 돌파구를 만들었습니다.
생성 모델 (Generative Models): 기존 데이터를 인식하는 것을 넘어 새로운 콘텐츠를 생성합니다.



비전-언어 모델: 텍스트와 이미지를 공유된 공간에서 함께 이해하고 처리하며, 시각적 질의응답(Visual Question Answering)과 같은 과제를 수행합니다.
3D 재구성 및 생성: 2D 이미지로부터 3D 표현을 만들고 생성하는 기술로, 로보틱스 및 AR/VR 분야에 필수적입니다.
구현된 에이전트 (Embodied Agents): 시각 지능을 바탕으로 물리적 세계에서 특정 임무(예: 방 청소)를 수행하는 에이전트를 다룹니다.


