


structure-oriented spatial control에 충분할 만큼 semantic, geometric information이 추출됨을 확인
handle points: target points: k-번째 step의 latent: UNet feature maps: Motion Supervision에 의해 변한 handle points의 위치를 tracking 하는 부분.
각 handle point 가 주변 patch 내에서 가장 가까운 feature vector를 찾도록 업데이트.
이때 nearest-neighbor search를 수행한다:

원본 latent: 최적화된 latent: