
2014년 발표된 GAN은 비지도 학습 중 적대적 (adversarial) 학습이란 독특한 방식을 사용해 인공지능 분야의 새로운 혁신을 일으켰다. 특히 styleGAN 등 다양한 이미지 생성 모델의 시초가 되는 아주 중요한 모델이다.그래서 이 모델을 생성 ai 시리즈의

생성 ai 시리즈의 두 번째 모델로 VAE를 알아볼 것이다. 이 시리즈의 최종 목표인 Diffusion model을 위해서는 반드시 거쳐야 할 관문인데, 수식이 너무 많아서 좀 미뤄왔었다. 이번에 정리해보면서 확률 쪽 공부를 다시 한 것 같다... 아직 부족하지만 최대

생성 ai 시리즈의 세번째 모델, 흔히 diffusion 모델로 부르는 대망의 DDPM이다. VAE와 마찬가지로 논문의 길이에 비해 수식이 많다. 따라서 본 포스트에는 최대한 DDPM의 핵심 수식과 그 발상을 위주로 알아보도록 하겠다. VAE, U-Net에 대해 미리

DDPM에 이어 생성 ai 시리즈 네번째 모델, DDIM을 알아보겠다. DDPM이 획기적이긴 하지만, GAN 등의 방법에 비해 생성 속도가 너무 느리다고 알려져 있다. 그렇기에 실제로 코드로 구현하고 생성 작업을 할 때는 DDIM이 더 많이 쓰인다고 한다. DDPM의

DDPM, DDIM 등 디퓨전 기반 생성 모델들이 발표된 뒤, 고질적인 속도와 리소스 문제를 해결하기 위해 다양한 연구들이 진행됐다. DALL-E 등 획기적인 모델들이 개발되었지만, 여전히 디퓨전 기반 모델들은 GAN에 비해 아쉬운 점이 많았다. 속도 뿐만 아니라 고화