Langevin Dynamics

김민서·2024년 7월 7일
0
  • Score Matching 과정 이후 샘플링에 쓰이는 알고리즘
    - prior distribution x0π(x)x_{0}\sim \pi (x)에서 시작해서 stochastic하게 샘플링
    xi+1xi + ϵx log p(x) + 2ϵ zi,   i=0,1,,Kx_{i+1} \leftarrow x_{i}\ +\ \epsilon \nabla_{x}\ log\ p(x)\ +\ \sqrt{2\epsilon}\ z_{i}, \ \ \ i=0,1,…,K
  • ϵ\epsilon : step size
  • ziz_{i} : Gaussian noise
  • ϵ0\epsilon \rightarrow 0이고 KK \rightarrow \infty일 때 xKx_K의 distribution은 pdatap_{data}와 같다
    • Proof (TODO)
    • 그러나 ϵ\epsilon이 충분히 작고 KK(step 수)가 충분히 크면 오차는 무시할 수 있다
  • langevin dynamics 수식에서 우리가 알아야 할 건 score function밖에 없으므로, 그 부분을 score matching 된 network sθ(x)s_{\theta}(x)로 바꾸면 pdatap_{data}에서 샘플링하는 것과 같은 효과를 낼 수 있다

0개의 댓글