optimization์ ์ฒ์ ์ ํ๋ ์ฌ๋์ด๋ผ๋ฉด ์ผ๋จ ์ด๊ฒ์ด ์ด๋ค multi variable scalar valued ํจ์์ max or min ๊ฐ๊ณผ ๊ทธ ์ง์ ์ ์์๋ด๋ ๊ฒ์ด ๋ชฉ์ ์ด๋ผ๊ณ ์ธ์ํ๊ณ ์์ํ์.
form of optimization problem
Find x that minimizes a (cost) function subject to or
๋ฌผ๋ก ๋ฌธ์ ๋ฅผ ์ค๊ณํ๊ธฐ ๋๋ฆ์ด์ง๋ง.. ์ผ๋จ optimization ๋ฌธ์ ๊ฐ ์ ์ค๊ณ๋์๊ณ ์ฐ๋ฆฌ๋ ๊ทธ๊ฑธ ํธ๋ ์
์ฅ์ด๋ผ๊ณ ๊ฐ์ ํ๋ค.
์ฐ๋ฆฌ๋ ์ด๋ค ๊ฐ์ minimizing ํ๊ณ ์ถ๋ค. ์ด ๋ฅผ ๋ชฉ์ ํจ์, cost function์ด๋ผ๊ณ ํ๋ค.
๋ด๊ฐ ๊ด์ฌ์๋ ๋ถ์ผ์์๋ ๋ณดํต cost function์ด error๋ฅผ ์๋ฏธํ๊ณ ๋น์ฐํ ์ด๊ฒ์ minimize ํ๊ณ ์ถ์ดํ๋ค.
์๋ ๊ฒฝ์ ์ด๋ฐ ์ชฝ์์๋ ์ด๋ค ๊ฐ์ด ๊ฐ์ฅ ํฌ๊ธธ ์ํ๊ธฐ๋ ํ๋๋ฐ ์ minimize๋ผ๊ณ ๋ง ํ๋๊ณ ํ๋ค๋ฉด ์ฌ์ค ๋ฅผ minimizeํ๋ ๊ฒ๊ณผ maximizeํ๋ ๊ฒ์ ๊ฐ์ ์ผ์ด๊ธฐ ๋๋ฌธ์ด๋ค. min of =max of ์ด๋ค. ๋ฅผ minimizeํ๊ณ ๋ค์ ์์๋ฅผ ์ทจํด ๋๋๋ฆฌ๋ฉด ๋๋ ์ฐ๋ฆฌ๋ minimize๋ง ๊ณ ๋ คํ๊ณ ๊ณต๋ถํ์.
์์์ ๊ฐ equality constraint์ด๊ณ ๊ฐ inequality constraint์ด๋ค.
์ ์ฝ์กฐ๊ฑด์ด๋ ์ฌ์ค ๋์ ํด๊ฐ ์กด์ฌํ ์ ์๋ ๋ฒ์๋ฅผ ์ขํ์ฃผ๋ ๋
์์ด๋ค. ๊ทธ๋์ ๋์ candidiate๋ผ๊ณ ์ฌ๊ธธ ์๋ ์๋ค. ๊ทธ ์์์ ํด๊ฐ ๋์ค๋๊น.
์ฌ์ค์ equality constraint๋ ์๋ค๊ณ ๋ณด๋ฉด ๋๋ค. machine precision ๋๋ฌธ์ด๋ค. ์ปดํจํฐ๋ ๊ณ์ฐ๊ธฐ๋ ๊ธฐ๊ณ๋ฅผ ์ด์ฉํด ํ ๋ ์ ํํ equality๋ฅผ ๋ง์กฑ์ํค๋ ๊ฒ์ ๊ฑฐ์ ๋ถ๊ฐ๋ฅํด์ ์ข์ ๋ฒ์๋ก inequality ์กฐ๊ฑด์ ๋๋ ์์ผ๋ก ์ฐํํ๋ค.
optimization์ด ๊ณง ์ด๋ค ์ ์ฝ์กฐ๊ฑด์ ๊ฐ์ง๊ณ cost function์ minimizeํ๋ ๊ฒ์ด๋ค.
์ํ๋ ๊ฒ์ ๊ทธ global min ๊ฐ๊ณผ ๊ทธ ๋์ .
์ด ์ํฉ์์ ์ด๊ณผ ์๋ฅ์ ๋ณธ ์ฐ๋ฆฌ๋ ์ผ, ์ด์ฐจ ๋ฏธ๋ถ์ ์๊ฐํ๋ค. ๋น์ฐํ ์ ์ด์ฉํ๋ฉด ๋๋ค.
๋ฌธ์ ๋ ์ด๋ ๊ฒ ์ฐพ์ ๊ฒ์ด local min์ธ์ง global min์ธ์ง ๋ชจ๋ฅธ๋ค๋ ๊ฒ์ด๋ค.
convex ํจ์๋ ํน์ ํ ์กฐ๊ฑด ํ์์๋ local min์ด ๊ณง global min (์ฐ๋ฆฌ๊ฐ ์ํ๋ ๋ฐ๋ก ๊ทธ point)์ด๋ค. ์ด๋ฐ ๊ฒฝ์ฐ์๋ ๋ฌธ์ ๊ฐ ๊ต์ฅํ ๋จ์ํด์ง๊ธฐ ๋๋ฌธ์ optimization ๋ฌธ์ ๋ฅผ convex ํจ์๋ก ๋ง๋ค๊ณ ์ถ์ด ํ๊ณ ๊ทธ๋์ ํ๊ธฐ ์ฝ๋๋ก convexizeํ๊ธฐ๋ ํ๋ค.
iterative method๋ฅผ ์ธ ๋ global optimal point๋ฅผ ์ฐพ๋ ๋ณด์ฅ๋ ๋ฐฉ๋ฒ์ ์๋ค. iterative method๋ ํญ์ iterate๋ฅผ ์์ํ starting point๊ฐ ํ์ํ๋ค. ๊ทธ starting point๋ฅผ ์ฌ๋ฌ ๊ฐ ์ก์์ ํด๋ณด๊ณ ๊ทธ์ค์ ์ ์ผ ๋์ ๊ฒ์ ๊ณ ๋ฅด๋ ๋ฐฉ๋ฒ๋ ์๊ณ ๊ทธ๋ ๋ค.
๐How to Minimize
์ด์ ๋ฅผ minimize ํ๋ ๋ฐฉ๋ฒ์ ์ง์คํด๋ณด์!
์ฌ๊ธฐ์์๋ ์ ์ฝ์กฐ๊ฑด์ด ์๋ (์ ์ฝ์กฐ๊ฑด์ด ์ธ) unconstrained์ ๋ํด์ ๋ค๋ฃจ๊ฒ ๋ค.
ํจ์์ ์ผ์ฐจ ๋ฏธ๋ถ์ด 0์ด ๋๋ ์ ์ critical point ๋๋ stationary point๋ผ๊ณ ํ๋ค. ํจ์์ ๊ทน์ , saddle point๊ฐ critical point์ ํด๋น๋๋ค.
ํจ์์ ์ด์ฐจ๋ฏธ๋ถ์ผ๋ก์จ ๊ทธ์ ๊ณก๋ฃ์ ๋ํ๋ด๋ Hessian์ critical point์ ์ข
๋ฅ๋ฅผ ํ๋ณํ๋ ๋ฐ ์ด์ฉํ ์ ์๋ค.
์ด๋ค multi variable scalar valued function์ optimizeํ๋ ๋ฌธ์ ์ด๋ค ํจ์๋ฅผ ์ ์ํ ๋ค์ ์ต์๊ฐ์ ์ฐพ๋ ๊ฒ์ด ๋ชฉ์ ์ด๋ค.
๋ณดํต์ ๊ฒฝ์ฐ ํจ์์ ์ผ์ฐจ ๋ฏธ๋ถ(gradient)๊ฐ 0์ด ๋๋ ์ง์ ์ ์ฐพ๊ณ ๊ทธ ์ง์ ์ด min/max/saddle point ์ค์ ๋ฌด์์ธ์ง๋ฅผ ์์์ผ ํ๋๋ฐ ๊ทธ๋ Hessian์ด ์ด์ฉ๋๋ค.
Find ciritical point
eigen value evaluation on that
all positive eigen values : local min
all negative eigen values : local max
positive and negative : saddle point
Hessian์ eigen vector๋ ๊ณก๋ฅ ์ด ๊ฐ์ฅ ํฐ ๋ฐฉํฅ์ผ๋ก์ ๋ฒกํฐ์ด๊ณ eigen value๋ ์ด ๊ณก๋ฅ ์ ๋ํ๋ธ๋ค.
Hessian์ symmetric matrix์ด๊ธฐ ๋๋ฌธ์ ํญ์ ๊ณ ์ ๊ฐ ๋ถํด๊ฐ ๊ฐ๋ฅํ๊ณ eigen value๊ฐ ์กด์ฌํ๋ค.
Hessian์ ๊ณ ๋ฑํ๊ต๋ ๊ณต๋ถํ๋ ๋ฐ๋ก ๊ทธ ์ด์ฐจ๋ฏธ๋ถ์ด๋ค. ์ด๋ ์ ์์ ๊ทธ ์ฃผ๋ณ์ ๊ณก๋ฅ ์ ๋ณด๋ ๊ฒ์ด๊ธฐ ๋๋ฌธ์ ๊ธฐ๋ณธ์ ์ผ๋ก max, min ์ด๋ผ๊ณ ๋งํด๋ ํญ์ local max, local min์ ๋งํ๋ ๊ฒ์ด๋ค. ์ฐ๋ฆฌ๊ฐ ์ฐพ๊ณ ์ถ์ ์ต์๊ฐ์ global min ์ธ๋ฐ ๋์ค์ ์ฐพ์ ๊ฒ์ด local min์ธ์ง global min์ธ์ง ๊ตฌ๋ถํ๊ธฐ ํ๋ ๊ฒ์ด ๋ฌธ์ ์ด๋ค.
convex ํจ์๋ผ๋ ํน์ ํ ์กฐ๊ฑด ํ์์๋ local min์ด ๊ณง global min (์ฐ๋ฆฌ๊ฐ ์ํ๋ ๋ฐ๋ก ๊ทธ point)์ด๋ค. ์ด๋ฐ ๊ฒฝ์ฐ์๋ ๋ฌธ์ ๊ฐ ๊ต์ฅํ ๋จ์ํด์ง๊ธฐ ๋๋ฌธ์ optimization ๋ฌธ์ ๋ฅผ convex ํจ์๋ก ๋ง๋ค๊ณ ์ถ์ด ํ๊ณ ๊ทธ๋์ ํ๊ธฐ ์ฝ๋๋ก convexizeํ๊ธฐ๋ ํ๋ค. ์ฌ๊ธฐ์์ ๊น๊ฒ ๋ค๋ฃจ์ง๋ ์๊ฒ ์ง๋ง ์ด๋ฐ ๊ฒ ์๋ค.
โ๏ธ~ : ~ ๋ผ๋ ๋ฌธ๊ตฌ๋ "๋ค์ ์กฐ๊ฑด์ ๋ง์กฑํ๋ ์์ ๊ฒ"์ด๋ผ๊ณ ์ฝ์ผ๋ฉด ๋๋คโ
์ฐธ๊ณ ์๋ฃ:
์ธํ๋ ๊น๊ด๊ธฐ ๊ต์๋์ ์์นํด์ ๊ฐ์
https://darkpgmr.tistory.com/132
https://angeloyeo.github.io/2020/06/17/Hessian.html