


Introduction의 위 그림에서 주어진 원래 이미지를 , 원래 이미지에서 시간의 흐름에 따라 noise를 추가해가는 과정을 라고 하면 에 noise를 적용하여 을 만드는 것을 라고 표현한다.
시간 t에 대해 계속해서 noise가 추가된다면 로 표현되고 시간 t가 끝까지 가면 는 완전히 destory된 noise 형태가 된다.
이때 원래 이미지 가 주어졌을때 t시간 후 noise가 된 의 분포는 아래 수식으로 표현가능하다.

이를 DDPM의 Forward process라고 하며, noise -> 이미지를 다시 생성하기 위해서는 Forward Process에서 학습된 의 분포인 를 학습하여야 한다.
간단히 말해서, Reverse Process는 noise인 에서 원래 이미지인 로 복원(생성)하는 과정이라고 볼 수 있다.
즉 Reverse Process는 노이즈로부터 이미지를 생성하는 Generative Model로 동작하기 때문에 앞선 Forward Process에서의 를 모델링하여야 하지만 이를 실제로 알아내는것은 어려운 일이다.
따라서 Reverse Process에서는 를 활용하여 를 approximate 하게 되며, 이때 approximate한 는 Gaussian transition을 활용한 Markov chain의 형태를 가지게 된다. 논문에서는 이를 아래 수식과 같이 나타내고 있다.

위 식에서 와 가 학습 과정에서 최적화되어야 할 파라미터라고 할 수 있다.(DDPM 모델 학습 과정에서 학습 및 최적화하는 부분이 이부분이다.)
의 파라미터들을 최적화시키기위해 적용되는 Object Function은 실제 생성하고자 하는 이미지의 분포인 ()를 구하는 것을 목적으로 하며 생성모델인 만큼 ()의 log likelihood를 최대화하여야 하므로 아래와 같은 수식으로 설명할 수 있다.

논문에서는 reverse process와 forward process를 Markov chain 기반으로 동작한다고 정의하였으므로, Markov property 적용가능하고 Gaussian 분포 간의 KL divergence 형태로 식을 변형하여 아래와 같은 최종 목적함수 식을 도출한다.

