kite_day.log
로그인
kite_day.log
로그인
[Daily report] 24-04-30
kiteday
·
2024년 4월 30일
팔로우
0
Daily report
0
Daily report
목록 보기
30/60
VIDU
칭화대와 공동 연구로 비디오 생성 서비스가 출시되었다. 앵글 전환, 자연스러운 consistency 유지 등 이미지 퀄리티가 좋다. vidu 팀에서 주장하기로는 Sora에 대항할 수 있다고 말한다. 60초 길이로 생성할 수 있으며 모델 구조에 U-ViT가 사용되었다고 한다.
MaPa: Text-driven Photorealistic Material Painting for 3D Shapes
diffusion을 이용한 3D shape을 생성한 모델. 모델 구조가 합리적으로 느껴진다.
PLLaVA : Parameter-free LLaVA Extension from Images to Videos for Video Dense Captioning
LLaVA의 신상모델. video2caption을 해주는 vision transform 모델이다.
HaLo-NeRF: Learning Geometry-Guided Semantics for Exploring Unconstrained Photo Collections
kiteday
공부
팔로우
이전 포스트
[Daily report] 24-04-29
다음 포스트
[Daily report] 24-05-01
0개의 댓글
댓글 작성