- Score Matching 과정 이후 샘플링에 쓰이는 알고리즘
- prior distribution x0∼π(x)에서 시작해서 stochastic하게 샘플링xi+1←xi + ϵ∇x log p(x) + 2ϵ zi, i=0,1,…,K
- ϵ : step size
- zi : Gaussian noise
- ϵ→0이고 K→∞일 때 xK의 distribution은 pdata와 같다
- Proof (TODO)
- 그러나 ϵ이 충분히 작고 K(step 수)가 충분히 크면 오차는 무시할 수 있다
- langevin dynamics 수식에서 우리가 알아야 할 건 score function밖에 없으므로, 그 부분을 score matching 된 network sθ(x)로 바꾸면 pdata에서 샘플링하는 것과 같은 효과를 낼 수 있다