[딥러닝]ONE-PEACE: 무제한 멀티 모달리티를 위한 일반 표현 모델

RCC.AI·2024년 5월 20일

딥러닝

목록 보기

32/52

비젼, 오디오, 언어 모달리티를 모두 아우르는 General Represenation Model

사전학습된 모델 없이도 통합된 작업들에 훌륭한 결과를 냄

강력한 Emergent Zero-shot Retrieval로 훈련 데이터에서 페어링 되지 않은 모달리티를 얼라인 가능

Audio-to-Image, Audtio+Text-to-Image, Audio+Image-to-Image

RCC.AI

따라가기도 벅찬 AI Engineer 겸 부앙단

이전 포스트

[딥러닝] Vision Transformer에 대한 시각적 설명

다음 포스트

[딥러닝]ONE-PEACE: 무제한 멀티 모달리티를 위한 일반 표현 모델

딥러닝

[딥러닝] Vision Transformer에 대한 시각적 설명

[딥러닝] Attention 신경망 구현

0개의 댓글