kite_day.log
로그인
kite_day.log
로그인
[Daily report] 24-03-06
kiteday
·
2024년 3월 6일
팔로우
0
Daily report
0
Daily report
목록 보기
7/60
issue
Paper
✔
Trajectory Consistency Distillation
latent의 정확도를 지키기 위해 distillation 방식으로 학습한다. consistency를 지키기 위한 방법. Hugging face 등으로 모델을 공개하고 있는 점이 활용도가 있다.
✔
VisionLLaMA: A Unified LLaMA Interface for Vision Tasks
LLaVA와 헷갈릴 수 있을 것 같은 제목이다. LLaMA를 백본으로 ViT 기반의 이미지 생성 논문
Panda-70M: Captioning 70M Videos with Multiple Cross-Modality Teachers
LLM은 대체 어디까지 갈건가.. Gemini같이 비디오를 바로 이해하여 텍스트를 출력해주는 모델들이 등장한다.
Learning and Leveraging World Models in Visual Representation Learning
잘 모르는 분야지만 Meta와 얀르쿤 교수님이 포함된 논문. 해당 분야에서 봐야할 논문인 것 맞는 것 같다.
StarCoder 2 and The Stack v2: The Next Generation
starcoder2가 나왔다. 페이퍼가 약 60장..
Viewfusion, TripoSR, ViewDiff
3개 모델 모두 single img input - 3D image generation model이다. 비슷한
✨
ResAdapter: Domain Consistent Resolution Adapter for Diffusion Models
adapter가 또 나왔다.
OOTDiffusion: Outfitting Fusion based Latent Diffusion for Controllable Virtual Try-on
예전에 졸프로 DayTD라는 프로그램 만들었었는데 이런 실제 virtual try on 모델들과 함께 하면 좋을거 같기도
think
T2I는 이미 자리잡았고 이제 더 나올 해상도가 없기 때문에 논문이 확장되는데 패턴이 있다.
Adapter 등 보조 도구
video
zero-shot, few-shot 등 쉬운 튜닝
대 AI시대에 GPT는 신이고 Diffusion은 절대 무너지지 않는 땅이다.. ←매번 이걸 갱신해서 느끼는 중..
kiteday
공부
팔로우
이전 포스트
[Daily report] 24-03-04
다음 포스트
[Daily report] 24-03-07
0개의 댓글
댓글 작성