TraDiffusion: Trajectory-Based Training-Free Image Generation
diffusion 모델로 이미지를 생성할 때 조건을 제어하는 방법은 두 가지가 있다. 하나는 adapter 등을 추가하는 것이고 다른 하나는 latent vecter zt자체를 제어하는 것이다. 해당 논문은 후자의 경우이다. diffusion step을 거치며 만들어지는 latent vecter의 trajectory를 수정하여 원하는 이미지를 만들어 내도록 한다. 수정을 위해서 energy function을 이용하였다.
TurboEdit: Instant text-based image editing
image editing 논문. LLaVA를 이용해 image-to-text를 한 다음 원하는 edit 부분만 수정한 text를 다시 생성할 이미지에 반영하는 방법이다. Adobe 논문이니 포토샵의 generative fill 기능에 업그레이드 되어 추가될지도? ECCV2024.