Stable Diffusion을 정의한 논문
컴퓨터 사용 리소스를 줄여서 가볍게 사용 가능
VAE
이미지와 같은 고차원 데이터를 encoding을 이용해 저차원의 hidden state로 표현 (성분 분해와 유사)-> decoder를 이용해 다시 이미지 생성(latent variable을 받아서 다시 복원)
x 데이터를 encoder에서 latent variable로 맵핑하는 방법
: 평균과 분산을 이용한 정규 분포 방식의 샘플링 사용
VAE ELBO
: Auto Encoder의 objective를 유도하는 공식
Diffusion model proces
auto encoder가 noise를 한번에 더하는 방식
diffusion은 noise를 더하는 방식에 스텝을 몇번을 나눠서 수행함
각각의 스텝 = 하나의 함수
스텝이 진행될 때마다 원본의 이미지가 좀 더 가우시안 분포에 가까워지는 과정 = diffusion process
함수식
- t-1 시점의 x가 t 시점으로 변화할 수 있는 forward 함수를 markov chain으로 형성 -> 전체적인 process의 정의