Duality에 대한 마지막 포스트에서는 Lagrange duality를 Generalized inequality constraint를 가진 문제로 확장하고자 한다. 포스트를 읽기에 앞서, 시리즈의 초반부에 등장하는 proper cone의 개념에 대해 간단하게 복습하고 넘어오는 것이 도움이 된다. 본 포스트에서 우리는 기본적으로 아래와 같은 optimization problem을 정의한다.
minimize xsubject to f0(x)fi(x)⪯Ki0,i=1,...,mhi(x)=0,i=1,...,p
이때 Ki⊆RKi는 proper cone이며, domain D가 nonempty 하다고 가정한다.
1. The Lagrange dual
위 최적화 문제에 대한 라그랑지안 및 dual function은 아래와 같이 정의된다.
L(x,λ,ν)=f0(x)+i=1∑pλiThi(x)+i=1∑mνiTfi(x)g(λ,ν)=x∈DinfL(x,λ,ν)=x∈Dinf {f0(x)+i=1∑pλiThi(x)+i=1∑mνiTfi(x)}
이는 앞서 살펴봤던 기본적인 문제들과 크게 다르지 않다. 라그랑지안이 dual variables (λ,ν)에서 affine하고, dual function이 라그랑지안의 pointwise infimum이므로 concave하며 p∗에서 lower bound를 갖는다. 이때 Nonnegativity의 유지를 위해, scalar inequalities의 λi≥0의 조금 더 확장된 형태인 λi⪰Ki∗0를 requirement로 갖는다.
Nonnegativity requirement λi⪰Ki∗0와 generalized inequality constraint인 fi(x)⪯Ki0가 주어졌다. 이제 dual cone의 정의를 떠올려보자.
K∗={y∣xTy≥0for allx∈K}
따라서 λTfi(x~)≤0이 성립하고, 이에 따라 f0(x~)+∑i=1pλiThi(x~)+∑i=1mνiTfi(x~)≤f0(x~)이 만족되어 weak duality인 g(λ,ν)≤p∗가 얻어진다. Dual problem은 다음과 같이 정리된다.
maximizeg(λ,ν)subject toλi⪰Ki∗0,i=1,...,m
나아가 primal problem이 convex하고 적절한 constraint 조건을 만족해야 strong duality (d∗=p∗)가 충족된다. 예를 들어 아래와 같은 generalized version의 Slater’s condition을 만족해야 한다.
x∈ relintDwithAx=bandfi(x)≺Ki0,i=1,..,m.
해당 조건을 만족하면서 dual optimum이 얻어진다면 strong duality가 만족된다.
2. Optimality conditions
Strong duality와 관련된 조건들을 계속해서 살펴보자.
Complementary slackness
Scalar inequality의 경우와 크게 다르지 않다. Strong duality가 성립한다면 아래의 식 역시 성립한다.
f0(x∗)=g(λ∗,ν∗)≤f0(x∗)+i=1∑mλi∗fi(x∗)+i=1∑pνi∗hi(x∗)=f0(x∗)
따라서 위의 식을 만족하기 위해서는 아래와 같은 조건이 필요하다.
λi∗Tfi(x∗)=0
결과적으로 complementary slackness는 아래의 3가지 경우에 만족될 수 있다.
(1) λi∗Tfi(x∗)=0,i=1,...,m(2) λi≻Ki∗0⟹fi(x∗)=0(3) fi(x∗)≺Ki0,⟹λi∗=0
이때 scalar inequality case와 달리 λi∗=0이고 fi(x∗)=0일 때도 식이 성립할 수 있다.
KKT condition
fi, hi가 모두 미분 가능하다고 가정해보자. 그렇다면 complementary slackness로부터 x∗가 라그랑지안을 최소화함을 알 수 있다.
▽f0(x∗)+i=1∑mDfi(x∗)Tλi∗ +i=1∑pνi∗▽hi(x∗)=0
Generalized Inequality 하에서 strong duality가 만족된다면 아래의 5가지 조건인 KKT condition이 만족되어야 한다.
fi(x∗)⪯Ki0, i=1,...,mhi(x∗)=0, i=1,...,pλi∗⪰Ki∗0, i=1,...,mλi∗Tfi(x∗)=0, i=1,...,m∇f0(x∗)+i=1∑mDλi∗+i=1∑pνi∗∇hi(x∗)=0(1)(2)(3)(4)(5)
3. Perturbation and sensitivity analysis
기존의 문제와 달리, 제약조건에 ui, vi를 집어 넣는 것을 perturbation이라 한다.
minimize xsubject to f0(x)fi(x)≤ui,i=1,...,mhi(x)=vi,i=1,...,p
Perturbed problem에서의 optimal value는 p∗(u,v)로 표현된다. 이때 inequality constraint의 ui가 양수라면 relaxed, 음수라면 tightened인 상태라고 칭하며, original problem의 optimal value는 p∗(0,0)이다. 만약 original problem이 convex하고 slater’s condition이 만족된다면 다음의 부등식이 성립한다.
p∗(u,v)≥p∗(0,0)−λ∗Tu−ν∗Tv
이에 대한 증명은 아래를 참고하라.
p∗(0,0)=g(λ∗,ν∗)≤f0(x)+i=1∑mλi∗Tfi(x)+i=1∑pνi∗Thi(x)≤f0(x)+λ∗Tu+ν∗Tv
따라서 f0(x)≥p∗(0,0)−λ∗Tu−ν∗Tv이 성립하며, 이는 p∗(u,v)의 하한을 제시해준다. 이때 만약 λi∗가 크고 i 번째 제약 조건이 tightened 되었다면 optimal value인 p∗(u,v)는 크게 증가한다. 이와 같은 변화에 대한 분석을 Sensitivity analysis라고 칭한다. 만약 p∗(u,v)가 u=0, v=0에서 미분 가능하다면 아래의 식이 성립한다.
λi∗=−∂ui∂p∗(0,0),νi∗=−∂vi∂p∗(0,0)
이에 대한 해석을 정리해보자.
- ui tightened & small → p∗ increase of −λi∗ui
- ui lossen & small → p∗ decrease of λi∗ui
- λi∗ small → constraint가 optimal value에 영향을 미치는 부분이 작다
- λi∗ big → constraint가 optimal value에 영향을 미치는 부분이 크다
이러한 perturbation은 generalized inequality 하에서도 성립되며, 그 기본적인 형태는 다음과 같다.
minimize xsubject to f0(x)fi(x)⪯Kiui,i=1,...,mhi(x)=vi,i=1,...,p
마찬가지로 zero duality gap 하에서는 p∗(u,v)≥p∗−∑i=1mλi∗Tui−ν∗Tv가 성립하며, 미분 가능한 조건 내에서 λi∗=−∇uip∗(0,0) 역시 만족된다.
4. Theorems of alternatives
기존의 Theorems of alternatives에 generalized inequality를 적용하여 이를 확장해보자.
Weak alternatives
fi(x)⪯Ki0,i=1,...,m,hi(x)=0,i=1,...,p(A)λi⪰Ki0 ,i=1,...,m,g(λ,ν)>0(B)
(A)와 (B)는 동시에 동시에 feasible할 수 없으므로, 위 둘은 weak alternatives이다. 증명을 위해서는 둘 다 feasible 하다고 가정했을 때 0<g(λ,ν)≤∑i=1mλiTfi(x)+∑i=1pνihi(x)<0의 모순이 발생함을 보이면 된다.
fi(x)≺Ki0,i=1,...,m,Ax=b(C)λi⪰Ki0 ,i=1,...,m,λ=0,g(λ,ν)≥0(D)
마찬가지로 (C)와 (D) 역시 weak alternatives의 관계를 가진다.
Strong alternatives
만약 x~∈relintD satisfying Ax~=b가 존재한다고 (즉 slatter’s condition을 만족) 가정하고 아래와 같은 문제를 고려해보자.
minimizesubject to wheresfi(x)⪯Kisei,i=1,...,mAx=bei≻Ki0,x,s∈R
위 문제의 dual problem은 아래와 같다.
maximizesubject to g(λ,ν)λ⪰Ki0,i=1,...,mi=1∑meiTλi=1
앞서 등장한 (C)와 (D)를 다시 보자. (C)가 infeasible할 경우 −fi(x)∈/intKi→−λTfi(x)≤0 이므로 λT(sei−fi(x))≥0→s≥0가 만족되고, slater’s condition에 의해 d∗=p∗를 만족하는 λ~, ν~, d∗=p∗≥0를 만족하는 λ~, ν~가 존재한다. 따라서 (D)는 infeasible하다. 마찬가지로 (C)가 feasible 하다면 (D)는 infeasible하므로, 둘은 strong alternative의 관계이다.
fi(x)⪯Ki0,i=1,...,mAx=b(E)λi⪰Ki∗0,i=1,...,m,g(λ,ν)>0(F)
Primal problem이 convex이고 x~∈relintD satisfying Ax~=b가 존재하며 optimal value가 얻어진다면, 두 부등식은 strong alternatives이다.