optimization, deep learning, computer vision ๋ฑ ์ด์จ๋ ์์จ์ฃผํ์ชฝ์ ๊ณต๋ถํ๋ฉด์ ๊ณ์ ๋ฑ์ฅํ๋ Jacobian, Hessian์ ๋ํด ์งง๊ฒ ์ ๋ฆฌํ๊ณ ์ ํ๋ค.
Jacobian๊ณผ Hessian์ ์ดํดํ ๋ ์ด๋ฏธ ์ต์ํ Gradient์ Laplacian์ ๋ ์ฌ๋ฆฌ๋ฉด ์ดํดํ๊ธฐ ํธํ๋ค.
๊ฐ๊ฐ์ ํํ๋ ์๋์ ๊ฐ๋ค.
Gradient
โf=โฃโขโขโขโขโขโกโโx1โโfโโx2โโfโโฎโxnโโfโโโฆโฅโฅโฅโฅโฅโคโ
Jacobian Matrix
J=โฃโขโขโขโขโขโกโโx1โโf1โโโx1โโf2โโโฎโx1โโfmโโโโx2โโf1โโโx2โโf2โโโฎโx2โโfmโโโโฆโฆโฑโฆโโxnโโf1โโโxnโโf2โโโฎโxnโโfmโโโโฆโฅโฅโฅโฅโฅโคโ
Laplacian
โ2f=โx12โโ2fโ+โx22โโ2fโ+โฏ+โxn2โโ2fโ
Hessian Matrix
H=โฃโขโขโขโขโขโขโกโโx12โโ2fโโx2โโx1โโ2fโโฎโxnโโx1โโ2fโโโx1โโx2โโ2fโโx22โโ2fโโฎโxnโโx2โโ2fโโโฆโฆโฑโฆโโx1โโxnโโ2fโโx2โโxnโโ2fโโฎโxn2โโ2fโโโฆโฅโฅโฅโฅโฅโฅโคโ
Gradient
โf=โฃโขโขโขโขโขโกโโx1โโfโโx2โโfโโฎโxnโโfโโโฆโฅโฅโฅโฅโฅโคโ
โf๋ multi variable scalar valued f(x1โ,x2โ,โฆ,xnโ)์ ์ผ์ฐจ ํธ๋ฏธ๋ถ ๋ฒกํฐ์ด๋ค.
๊ทธ ์์ฒด๋ก๋ multi variable vector valued funtion
- ์ฐธ๊ณ : mult/uni variable์ input, vector/scalar valued๋ output์ ์๋ฏธํจ
๊ฐ ๋ณ์๋ก์ ์ผ์ฐจ ํธ๋ฏธ๋ถ์ผ๋ก ๊ตฌ์ฑ๋์ด ์๋ค.
์ด ๋ฒกํฐ๋ f๊ฐ ๊ฐ์ฅ ๊ฐํ๋ฅด๊ฒ ์ฆ๊ฐํ๋ ๋ฐฉํฅ๊ณผ ๊ทธ ์ ๋๋ฅผ ๋ํ๋ธ๋ค.
์์ -๋ฅผ ๋ถ์ธ โโf ๋ f๊ฐ์ด ๊ฐ์ฅ ๊ฐํ๋ฅด๊ฒ ๊ฐ์ํ๋ ์ชฝ์ ๋ํ๋ด๊ฒ ๋๋ค.
์ด๋ฅผ ์ด์ฉํ์ฌ ์๋ ๋ฐฉ๋ฒ์ผ๋ก ๋ง์ด ์ด์ฉ๋๋ค.
-
Gradient Descent for Optimization
โโf(x)์ชฝ์ผ๋ก updateํ์ฌ ์ต์๊ฐ ํ์
-
First Order Taylor Expansion
f(x)โf(p)+โf(p)(xโp)
-
Edge Detection in Image
Jacobian Matrix๐ฉ
J=โฃโขโขโขโขโขโกโโx1โโf1โโโx1โโf2โโโฎโx1โโfmโโโโx2โโf1โโโx2โโf2โโโฎโx2โโfmโโโโฆโฆโฑโฆโโxnโโf1โโโxnโโf2โโโฎโxnโโfmโโโโฆโฅโฅโฅโฅโฅโคโ
J๋ F:RnโRm ์ธ multi variable vector valued F(x1โ,x2โ,โฆ,xnโ)์ ๋ํ ์ผ์ฐจ ํธ๋ฏธ๋ถ์ผ๋ก ์ ์๋๋ค.
gradient์ ์ฐจ์ด์ ์ด๋ผ๋ฉด F๊ฐ vector valued๋ผ๋ ๊ฒ.
gradient๋ฅผ vector valued ํจ์์ ๋ํด์ ํ์ฅํ๋ค๊ณ ๋ณด๋ฉด ๋๋ค.
F(x1โ,x2โ,โฆ,xnโ)=โฃโขโขโขโขโกโf1โ(x1โ,x2โ,โฆ,xnโ)f2โ(x1โ,x2โ,โฆ,xnโ)โฎfmโ(x1โ,x2โ,โฆ,xnโ)โโฆโฅโฅโฅโฅโคโ
entry ๊ฐ๊ฐ์ ํจ์์ ํํ๋ฅผ ๋์ง๋ง ์๋ ํจ์๊ฐ quadratic form์ธ ๊ฒฝ์ฐ์ ํํด ์์๋ก ๋์ฌ ์๋ ์๋ค.
Jacobian๋ ์ผ์ฐจ๋ฏธ๋ถ์ ์ ์์ ๋ฐ๋ฅด๊ธฐ ๋๋ฌธ์ ์ ํ ๊ทผ์ฌ๋ ๊ฒฝ์ฌ ํ๊ฐ๋ฒ์ ๊ทธ๋๋ก ์ ์ฉํ ์ ์๋ค.
- First Order Taylor Expansion
F(x)โF(p)+J(p)(xโp)
Laplacian
โ2f=โx12โโ2fโ+โx22โโ2fโ+โฏ+โxn2โโ2fโ
โ2f๋ gradient์ ๋ง์ฐฌ๊ฐ์ง๋ก multi variable scalar valued f(x1โ,x2โ,โฆ,xnโ)์ ๋ํ ์ด์ฐจ ํธ๋ฏธ๋ถ ๊ฐ์ ํฉ์ผ๋ก ์ ์๋๋ค.
Laplacian ์์ฒด๋ก๋ multi variable scalar valued ๋ก, output์ 2์ฐจ ํธ๋ฏธ๋ถ ๊ฐ์ ํฉ์ธ scalar์ด๋ค.
์ด๋ 2์ฐจ๋ฏธ๋ถ์ด๋ ๋ณํ๋์ ๊ธ๊ฒฉํ ์ ๋๋ฅผ ๋ํ๋ธ๋ค.
์์์ฒ๋ฆฌ์ edge detection์์ ๋ฐฐ์๋ณธ ์ฌ๋๋ ์์ํ
๋ฐ ์ด๋ฏธ์ง์ pixel๊ฐ ํจ์ I=f(x,y)์ ๋ํ Laplacian์ ๋ณํ๊ฐ ์๋๋ผ๋ ๊ท ์ผํ ๋ถ๋ถ์ ์์ ๊ฐ์, ๋ณํ๊ฐ ๊ธ๊ฒฉํ ๋ถ๋ถ์ ํฐ ๊ฐ์ ๊ฐ์ผ๋ฏ๋ก ๊ทธ๋ฅ ๋ฏธ๋ถ๊ฐ์ ๋นํด ๋ edge์ค๋ฌ์ด ๋ถ๋ถ์ ์ฐพ๊ฒ ํด ์ค๋ค.
๋ค๋ง, ์ฑ๋ฅ์ฐจ์ด์ ๋นํด์ 2์ฐจ๋ฏธ๋ถ์ ๋๋ computation ๋ถ๋ด์ด ์ปค์ ์ค์ ๋ก laplacian์ ์ ์ด์ฉํ์ง๋ ์๋๋ค๊ณ ํ๋ค.
Hessian Matrix๐ฉ
H=โฃโขโขโขโขโขโขโกโโx12โโ2fโโx2โโx1โโ2fโโฎโxnโโx1โโ2fโโโx1โโx2โโ2fโโx22โโ2fโโฎโxnโโx2โโ2fโโโฆโฆโฑโฆโโx1โโxnโโ2fโโx2โโxnโโ2fโโฎโxn2โโ2fโโโฆโฅโฅโฅโฅโฅโฅโคโ
H (Hessian Matrix)๋ multi variable scalar valued f(x1โ,x2โ,โฆ,xnโ)์ ๋ํ ์ด์ฐจ ํธ๋ฏธ๋ถ์ผ๋ก ์ ์๋๋ค.
ํ์์ ๊ด์ฌ๋ถ์ผ์์ Hessian์ optimization ๋ถ์ผ์ ๋ฑ์ฅํ๋ ๋์ด๋ค.
-
Hessian์ ์ด์ฐจ๋ฏธ๋ถ, ์ฆ ํจ์์ curvature(๊ณก๋ฅ )์ ๋ํ๋ธ๋ค.
์ด ์ฑ์ง์ ์ด๋ค ํจ์์ ์ต์๊ฐ์ ๋๋ฌํ๋ ๊ฒ์ด ์ฃผ ๋ชฉ์ ์ธ optimizatioin ๋ฌธ์ ๋ฅผ ํธ๋ ๋ฐ ์์ฃผ ์ด์ฉ๋๋ค.
-
Hijโ=Hjiโ๋ก symmetric matrix์ด๋ค. Symmetic matrix๊ฐ ๊ฐ์ง๋ ๋งค์ฐ ํน๋ณํ ์ฑ์ง๋ optimization์์ ์ด์ฉ๋๋ค.
-
Second Order Taylor Expansion
f(x)โf(p)+โf(p)(xโp)+21โ(xโp)TH(p)(xโp)
โ๏ธ ํ๋ ฌ๊ณผ ๋ฒกํฐ์ ์ ๊ณฑ์ ํํํ ๋ ํ๋ ฌ ์์ transpose, ๋ค์ ๊ทธ๊ฒ์ ๋ค์ ๊ณฑํ์ฌ xTHx ํํ๋ก ์ด๋ค โ
์ฐธ๊ณ ์๋ฃ:
์ธํ๋ ๊น๊ด๊ธฐ ๊ต์๋์ ์์นํด์ ๊ฐ์
https://darkpgmr.tistory.com/132
https://angeloyeo.github.io/2020/06/17/Hessian.html
์ถ๊ฐ์ ๋ณด, ์ง์ ๋ฑ ๋๊ธ ํ์ํฉ๋๋ค.