[Daily report] 24-03-25

kiteday·2024년 3월 25일

Daily report

목록 보기

14/69

paper

ReNoise: Real Image Inversion Through Iterative Noising
inversion과 editing에 대한 논문
Efficient Video Diffusion Models via Content-Frame Motion-Latent Decomposition
NVIDIA, KAIST가 같이 쓴 ICLR 2024
StyleCineGAN: Landscape Cinemagraph Generation using a Pre-trained StyleGAN
오랜만의 StyleGAN 기반 논문. KAIST
Gaussian Frosting: Editable Complex Radiance Fields with Real-Time Rendering
Cobra: Extending Mamba to Multi-Modal Large Language Model for Efficient Inference
Mamba에 이어 Cobra,, 뱀의 향연
Evaluating Frontier Models for Dangerous Capabilities
현 LLM들이 얼마나 위험한지 평가하는 연구. AI 윤리나 안정성에 대한 연구와 논란도 끊이지 않는 주제이다.
When Do We Not Need Larger Vision Models?
vision tasks에서 VLLM이 필요 없고 작은 모델만으로도 가능하다고 이야기 함.
IDAdapter: Learning Mixed Features for Tuning-Free Personalization of Text-to-Image Models
UNet 에서 self attention과 cross attention 사이에 adapter를 넣었다.
SceneScript: Reconstructing Scenes With An Autoregressive Structured Language Model
비디오 스트림에도 장면에 맞는 scene scripts를 짜주는 모델.
✨Magic Fixup: Streamlining Photo Editing by Watching Dynamic Videos
포토샵을 가지고 수정할 수 있는 모델. 역시 어도비에서 썼다.
[HyperLLaVA: Dynamic Visual and Language Expert Tuning for Multimodal Large Language Models](https://arxiv.org/pdf/2403.13447.pdf
ZigMa: Zigzag Mamba Diffusion Model
지그제그가 Z모양이 아니고 ㄹ모양으로 지그제그를 해여 각 패치를 계산한다.
Evolutionary Optimization of Model Merging Recipes
Japanese Language model이 초점이 되어 있는 것 같긴 한데, 일본에서 나온 페이퍼는 매우 드물어서 조금 신기.
Be-Your-Outpainter: Mastering Video Outpainting through Input-Specific Adaptation
비디오 outpainting 논문

kiteday

공부

이전 포스트

[Daily report] 24-03-21

다음 포스트

[Daily report] 24-03-25

Daily report

paper

[Daily report] 24-03-21

[Daily paper] 24-03-26

0개의 댓글