Convexity
Convex Sets
- 두 points의 convex combination 은 line segment between them.
λx1+(1−λ)x2,λ∈[0,1]

- A set C∈Rn에 대해, C 안의 임의의 두 점 x1,x2의 convex combination이 항상 C에 포함되면 이를 convex 하다고 한다.
λx1+(1−λ)x2∈C,∀λ∈[0,1]

기하학적으로는 오목하게 들어간 부분이나 내부에 구멍이 없는 집합이다.
- A set C 내 점들의 모든 convex combination을 C의 convex hull (conv(C)) 이라고 한다.
conv(C)={i=1∑kλixi∣i=1∑kλi=1,λi≥0,i=1,…,k}

conv(C)는 집합 C를 포함하는 가장 작은 convex set이다.
Convex Functions
- Let f:C→R, where C is a nonempty convex set in Rn.
The function f is said to be convex on C if x1,x2∈C with 0≤λ≤1f(λx1+(1−λ)x2)≤λf(x1)+(1−λ)f(x2)
- concave : if −f is convex on C.
- strictly convex or strictly concave if the equality doesn't hold.
Convex function f는 domain 위의 임의의 두 점을 이은 선분이 항상 f 위에 있다.
Theorem: Jensen's inequality
For a convex function f and ∑i=1kλi=1,λi≥0 ∀i,
f(i=1∑kλixi)≤i=1∑kλif(xi)
∑i=1kλixi를 확률(합이 1)에서의 기댓값으로도 볼 수 있다: f(E[x])≤E[f(x)].
Theorem: First-order conditions
Let C be a nonempty open convex set in Rn, and let f:C→R be differentiable on C.
Then f is convex if and only if for any x,y∈C, we have,
f(y)≥f(x)+∇f(x)T(y−x)
Convex function은 항상 특정 point (x,f(x))의 접선보다 크거나 같다.
Convexity and Optima
Critical Points
여기서 말하는 제약이 없는 최적화 문제 (unconstrained problem)는 최소화 문제(minimizing problem)을 말한다.
minimizing f(x) over Rn에 대해,
-
If f(x∗)≤f(x) for all x∈Rn, then x∗ is called a global minimum.
-
If f(x∗)≤f(x) for all x∈Nε(x∗), then x∗ is called a local minimum.
-
If f is differentiable and ∇f(x∗)=0, then x∗ is called a critical point of f.
-
If x∗ is a critical point, but neither a maximum nor a minimun, then x∗ is called a saddle point.
단, critical point가 아니더라도, local maximum (또는 minimum)이 나타날 수 있다.
Convex Optimization Problem
- Convex set C에 대해, 함수 f가 C 상에서 convex function이면, x∈Cminf(x)를 Convex optimization problem (CO)라고 말한다.
CO에서는 local optima가 곧 global optima라는 좋은 성질이 있다.
Theorem: Convex optimization problem
x∗ is a local minimum for (CO), if and only if, x∗ is a global minimum for (CO).
주어진 optimization 문제가 CO인지 확인하기 위해서는 우선 domain이 convex set인지 확인해야 하며, 이후 해당 set 위에서의 f에 대한 Hessian matrix가 SPD인지 확인해야 한다.
Theorem: Second-order conditions
Let C be a nonempty open convex set in Rn, and let f:C→R be twice differentiable on C.
Then f is convex if and only if its Hessian ∇2f(x) is positive semidefinite for all x∈C.
또한, f의 Hessian matrix에 대한 postive definiteness 검증을 통해 f가 strictly convex function임을 보일 수 있다.
Lemma:
If the Hessian matrix is positive definite, then f is strictly convex.
If f is strictly convex and quadratic then its Hessian matrix is positive definite at each point of C.
참고로, 2x2 matrix A=[abbc], 의 경우 a>0, ac−b2>0 를 만족하면 postive definite이다.