kite_day.log
로그인
kite_day.log
로그인
[Daily report] 24-05-31
kiteday
·
2024년 5월 31일
팔로우
0
Daily report
0
Daily report
목록 보기
38/60
Matryoshka Multimodal Models
같은 이미지에 대해 단계별로 풍성한 텍스트 description을 생성하는 코드. 일전에 마트료시카라는 이름의 paper를 한 번 봤었는데 관련이 있는 paper인지는 잘 모르겠다. MS research에서 했다.
Collaborative Video Diffusion: Consistent Multi-video Generation with Camera Control
view를 조정하는 비디오 모델. 기존 모델 (stable diffusion)을 백본으로 이용하고 camera trejectory를 입력으로 줘 학습한다.
Phased Consistency Model
LLaMA-NAS: Efficient Neural Architecture Search for Large Language Models
✨
3DitScene: Editing Any Scene via Language-guided Disentangled Gaussian Splatting
3D gaussian splatting 관련 모델. 한 장의 이미지에 대해 3D scene을 생성해준다. 코드 등 정리가 잘되어 있다.
LoRA 변종들이 몇 개 나왔다. VeLoRA, Trans-LoRA
적은 데이터로 큰 학습을 하고 싶은 욕구는 계속된다.
kiteday
공부
팔로우
이전 포스트
[Daily report] ✨24-05-28
다음 포스트
[Daily report] 24-06-05
0개의 댓글
댓글 작성