논문 링크: HyperCLOVA X 8B Omni
인코더
토크나이저
디코더
텍스트 사전학습
개별적(Discrete) 모달리티 토큰 학습
연속적 모달리티 인코더 통합
데이터 구성 및 전략
학습 방법
비전-텍스트 벤치마크
텍스트-비전 벤치마크
정성 평가
비디오 벤치마크
스피치/오디오-텍스트 벤치마크
스피치-스피치 벤치마크
텍스트-스피치 사람 평가