이 포스트는 Bernamou et al.(2015), Iterative Bregman Projections for regularized transportation problems, SIAM 논문의 초반부를 읽고 참고한 것이다.
Optimal transport 문제에서 optimal coupling을 찾는 것은 많은 컴퓨팅을 필요로 하고, iterative bregman projection을 기반으로 한 sinkhorn algorithm 등이 많이 쓰인다. 이 포스팅에서는 iterative bregman projection의 entropic OT regularization에 대하여 설명한다.
Entropic OT problems
OT 문제에서 목적함수로 우리는 주로 entropic regularization을 고려한다.
argminγ∈Π(μ,ν)<γ,C>F+ϵH(γ),
where H(γ)=∑ijγijlogγij
이러한 entropic regularization term은 γ의 non-sparsity(smoothness)를 유도한다.
하지만 이와 더불어, solution을 구하는 데에 있어 추가적인 이점을 주기 때문에 많이 쓰이는 것도 있다.
우선, 위의 Loss는 entropy term이 추가됨으로써, strongly convex하게 된다. 즉, unique minimizer γ∗가 존재한다.
이 때 제약조건 γ∈Π(μ,ν) 가 없는 경우를 고려하면, γ∗=e−ϵC 임을 구할 수 있다.
위의 최적화 문제를 약간 다른 관점에서 생각해보자.
"위의 최적화 문제의 해는 제약조건이 없는 경우의 해 γ∗를 벡터공간 S={γ∣γ∈Π(μ,ν)} 에 KL divergence에 대하여 projection 한 것이다."
즉, 위의 최적화 문제는 다음과 같이 쓸 수 있다.
argminγ∈Π(p,q)KL(γ∣ξ) where ξ=e−ϵC
왜 이와 같이 표현될 수 있는가 하면,
KL(γ∣ξ)=∑ijγijloge−ϵCγij=∑ijγijlogγij+ϵ1∑ijγijCij=H(γ)+ϵ1<γ,C>F 이기 때문이다.
이제 다음과 같은 projection을 정의하자.
PCKL(ξ):=argminγ∈CKL(γ∣ξ)
이러한 projection의 해를 구하는 방법이 Iterative Bregman projection이다.
Iterative Bregman Projection
Setting
Iterative Bregman projection에서는 다음의 상황을 다룬다.
minγ∈CKL(γ∣ξ)) where ξ is a given point in R+N×N , and C is a intersection of closed convex sets
C=∩l=1LCl s.t. C has nonempty intersecton with R+N×N.
추가적으로, set Cl의 index의 확장을 위해 ∀n∈N,Cn+L=Cn이라고 한다. 이는 지속적인 iteration을 위함이다.
Iterative Bregman Projections
(이하 IBP)
구하고자 하는 최적화 문제의 해는 아래의 알고리즘을 통해 구할 수 있다
이 때 Cl은 convex affine subspace이다.
- Let γ(0)=ξ
- define ∀n>0,γ(n)=PCnKL(γ(n−1))
Then, γ(n)→PCKL(ξ) as n→∞
Dykstra's Algorithm
이 때 Cl이 affine subspace이 아니라면, 수정된 버전인 Dykstra's algorithm을 사용해야 한다.
Solving entropic OT problem via iterative bregman projection
위의 IBP를 그래도 entropic ot 문제를 푸는 데 적용 할 수 있다.
이는 ξ를 C1={γ;γ1=p}, C2={γ∈γT=q}의 intersection 위에 projection 하는 것이고, 이 때 C1,C2는 모두 convex affine subspace임으로, 그대로 적용이 가능하다
참고로, PC1KL(γ)=diag(γˉ1p)γˉ, PC2KL(γ)=γˉdiag(γˉT1q) 로 계산된다.