논문은 많이 읽지만 리뷰하고 수식을 다 뜯어서 발표자료까지 만드는 리뷰에는 한계가 있다.자료들이 정리가 안되기도 하고 그냥 버리기 아쉬워서 시간날 때 인상 깊었던 논문 위주로 리뷰를 업로드 하려고 한다.
해당 모델은 story visualization의 초창기 논문이다. 따라서 다른 것(이미지 퀄리티 등)보다 텍스트와 이미지의 상관관계에 대해 초점을 맞췄다. RNN 같은 sequential 구조에 encoder와 GAN 구조가 합쳐져있다.encoder로 GRU와 Tex
https://aim-uofa.github.io/AutoStory/1Introductionstory visualization 논문.pretrained SDM을 사용하여 train-free generation이 가능하다.
https://storydiffusion.github.io/ ByteDance에서 한 연구. 그래서 paper만 있으리라 생각했는데 무려 code와 hugging face demo(언제 사라질 지 모르지만)까지 제공한다. Introduction consistent
24.11.01 기준 새로운 story visulization 논문 모음Training-Free Consistent Text-to-Image GenerationMasked Generative Story Transformer with Character Guidance a