kite_day.log
로그인
kite_day.log
로그인
[Daily report] 24-04-23
kiteday
·
2024년 4월 23일
팔로우
0
Daily report
0
Daily report
목록 보기
27/60
✔
Groma: Localized Visual Tokenization for Grounding Multimodal Large Language Models
MLLM에 대한 논문. tokenizer로 각 박스를 만들고(원하는 영역을 자유롭게 지정) 해당 위치의 이미지를 텍스트로 바꾼다. method 그림에서 제시하는 paradaim 그림이 매우 효과적으로 이해를 돕는다.
✨
Does Gaussian Splatting need SFM Initialization?
gausian splatting의 새로운 초기화 방식을 제안한 논문. 기존 방법은 NeRF와 비슷한데 이는 굉장히 많은 연산을 요구한다는 한계가 있다. 특히 random initialization 부분에서 그러하기 때문에 새로운 방식의 연산을 제시한다.
✨
PhysDreamer: Physics-Based Interaction with 3D Objects via Video Generation
카메라 view를 움직이는 3D 모델. 실시간으로 object의 움직임을 제어할 수 있다.
kiteday
공부
팔로우
이전 포스트
[Daily report] 24-04-22
다음 포스트
[Daily report] 24-04-25
0개의 댓글
댓글 작성