Lie Theory(리 이론, 회전의 최적화) - Basic in SO(n)

선비Sunbei·2024년 6월 20일

Optimization

목록 보기

3/4

최적화는 여러 방법을 통해서 $\Delta\theta$ 를 구해서 기존 $\theta$ 에 업데이트 해주는 방법이다.
그렇지만 회전의 경우 제약 조건이 존재한다. $det(R)=1$ , $RR^T=R^TR=I$ 다음과 같이 determinant가 1인 직교 행렬이어야 한다.
즉, 회전은 비선형(제약 조건이 있는) 공간에 있다는 문제점이 있다.
따라서 lie algebra를 이용해서 선형적인 공간으로 만들어서 $\Delta\theta$ 를 구하는 것이 목표이다.

먼저 리 군과 리 대수에 대해서 알아야 한다.

Lie Group (리 군)

군의 정의

$\cdot$ 에 의해 연산된 결과는 여전히 리 군에 닫혀있어야 한다.

Identity가 존재해야 한다.

리 군의 inverse가 리 군 내에 존재해야 한다.

결합 법칙이 성립해야 한다.

위는 군의 정의이다. 리 군은 역시나 군에 속하기 때문에 위의 정의에 만족해야 한다.
이러한 군에 Smooth Manifold라는 제약 조건이 붙은 것을 Lie Group이라고 정의한다.

여기서 Manifold는 국소적으로는 유클리드 공간과 유사한 특성을 갖는 공간을 얘기한다.
제약 조건이 있는 높은 차원의 데이터에서 더 낮은 차원이 n인 공간이 있다고 하자.
이 공간이 유클리드 공간과 비슷해보이는 n차원이면 Manifold라고 부른다.

그리고 Smooth는 sharp edge와 spike가 없는 즉, 미분할 수 없는 공간이 없는 공간을 얘기한다.

예를 들어, 3차원인 구면 공간에서는 제약 조건 $[(x,y,z) , x^2 + y^2 + z^2 = 1]$ 인 공간인데, 접면(tangent space)은 평면( $[(a,b)]$ )으로 제약 조건이 없는 유클리드 공간이다.
이러한 접면을 Manifold라고 부른다.

회전행렬의 수학 기호로는 SO(n)라 하며, Special Orthogonal Group(특수 직교 군)을 얘기한다.
n는 차원 수로 3차원 회전이면 n는 3, 2차원 회전이면 n는 2인 형태이다. (freedom 차원 수)

외에 Translation과 회전행렬을 포함하는 리 군을 수학 기호로 SE(n), 특수 유클리드 군이라고 한다.

Lie Algebra (리 대수)

리 대수는 리 군의 항등원(ex> Identity matrix)에서의 tangent space를 lie algebra라고 얘기한다.
엄밀한 수학적인 정의에서는 다음과 같다.

리 대수는 벡터 공간의 구조와 함께 Lie 괄호(Lie Bracket)라는 추가적인 이항 연산을 가지며 반대칭성과 Jacobi 항등식을 만족해야 한다.
(리 괄호는 리 대수 집합에서 정의된다.)

반대칭성(Anti-symmetric) : 모든 $x,y\in g$ 에 대해 $[x,y] = -[y,x]$
Jacobi 항등식(Jacobi Identity) : 모든 $x,y,z\in g$ 에 대해 $[x,[y,z]] + [y,[z,x]] + [z,[x,y]] = 0$

회전 행렬의 리 대수는 skew-symmetric matrix이다. (lie algebra가 반드시 skew-symmetric matrix여야 하는 것은 아니다. 뒷쪽에서 회전 행렬이 skew-symmetric matrix 임을 증명한다.)
행렬의 리 대수에서는 다음과 같은 Lie 괄호를 정의하여 Lie 대수를 다룬다. $[A,B] = AB - BA$ (이것은 lie bracket을 성립하는 하나의 연산 예이다.)
행렬은 교환법칙이 성립하지 않기 때문에 (항등원이 아니면) 해당 리 대수는 0이 아니게 된다.

조금 더 깊게 들어가면
$R_1R_2 \neq R_2R_1$ 인 교환법칙이 성립하지 않는 것(비가환성)을 곡률로 해석하는 방법을 응용하는 것이다.
여기서 곡률이란 일반적인 리만 기하학이 아닌, "작은 이동의 순서를 바꾸면 결과가 달라지는 구조"에 대한 곡률이다.

lie bracket은 1차 곡률을 측정하는 연산이다.
'Lie group의 항등원(Identity matrix)에서 정의된 Tangent space'와 '비가환성을 가진 rotation의 항등원(Identity matrix)의 좁은 공간'에서의 곡률 사이의 비가환성을 측정하는 것이다.

리 군과 리 대수의 변환 관계 (Exp 연산자, Log 연산자)

파란색 구는 lie group을 시각화를 위해 나타낸 것이고, 빨간색 평면은 lie algebra의 tangent space를 시각화를 위해 평면으로 나타낸다.

리 대수는 exp 연산자를 통해서 리 군으로 되고, 리 군은 log 연산자를 통해서 리 대수가 된다.

1차원에서의 complex number를 lie group으로 생각하면 조금 더 이해하기 쉽다.
1차원 complex number는 x축이 실수, y축이 허수로 2차원이 된다. 다만 제약 조건으로 $z^*z=1$ 이다.
해당 제약 조건의 공간을 수학식으로 나타내면 다음과 같다.

e^{i\theta} = cos\theta + i \times sin\theta

identity인 1에서의 tangent space는 (즉, lie algebra) 1차원이 된다.
그리고 $i\theta$ 가 리 대수가 된다. 여기서 i를 축(1D basis vector) 해석할 수 있다는 점을 기억하자!
또한 exp 연산을 통해서 리 군( $e^{i\theta}$ )으로 되는 것을 볼 수 있다. 반대로 log 연산을 통해 리 대수가 된다.
여기서 $\theta$ 가 $-\pi \leq \theta \leq \pi$ 로 제한되어야 되는 것을 볼 수 있다. 왜냐하면 리 군에서 리 대수로의 매핑이 1대1 함수가 아니기 때문이다. (sin, cos에 의해)

2차원에서의 회전을 보면 제약 조건은 $R^TR = RR^T = 1$ , $det(R)=1$ 이다.
그리고 수학식으로 R을 나타내면 다음과 같다.

R = \begin{bmatrix} cos\theta & -sin\theta \\ sin\theta & cos\theta \\ \end{bmatrix} = Icos\theta + [1]_\times sin\theta \\ \; \\ [1]_\times := \begin{bmatrix} 0 & -1 \\ 1 & 0 \\ \end{bmatrix}

1D complex number와 마찬가지로 오일러 법칙에 따라서 리군의 x축이 $I$ , y축이 $[1]_\times$ (i역할) 인 것으로 $e^{\theta[1]_\times}$ 로 정리할 수 있다.
Identity matrix에서의 tangent space로 보면 $\theta [1]_\times \;(:= [\theta]_\times)$ 를 리 대수로 해석할 수 있다.

\\ \; \\ \;\\\;\\\;\\\;\\

위와 같은 논리로 3D도 표현이 가능하다.
2차원 회전과 마찬가지로 3차원도 같은 제약식을 갖는다.

3차원 회전에서의 수학식을 보겠다. 여기서 3차원 회전은 오일러 회전, 쿼터니언 회전, 로드리게스 회전 중 로드리게스 회전의 수학식이다.
로드리게스 회전이란 특정 축으로의 회전을 얘기한다. 아래 식에서 w가 회전하려는 축의 방향벡터를 얘기한다.
여기서 $\tau$ 는 $\theta u$ 로 정의된다. ( $|u| = 1$ )
로드리게스 회전 공식은 반드시 $\tau$ 가 unit vector일 필요는 없다.
다만 unit vector인 경우가 정확히 원뿔 궤적을 그리지만 unit vector가 아닌 경우 유사하게 원뿔 궤적을 그린다고 한다.

R = I + \frac{sin\theta}{\theta}\hat{\tau} + \frac{1-cos\theta}{\theta^2}\hat{\tau}^2

여기서 w는 cross product의 matrix 형태를 얘기한다. (로드리게스 회전 공식을 정리한 결과임)

\tau \times v = \begin{bmatrix} \tau_yv_z - \tau_zv_y \\ \tau_zv_x - \tau_xv_z\\ \tau_xv_y - \tau_yv_x\\ \end{bmatrix} = \begin{bmatrix} 0& -\tau_z & \tau_y \\ \tau_z & 0 & -\tau_x \\ -\tau_y & \tau_x & 0 \\ \end{bmatrix} \begin{bmatrix} v_x\\v_y\\v_z \end{bmatrix} = \hat{w}v

로드리게스 회전 공식에서부터 출발하면 다음과 같다.

I + \frac{sin\theta}{\theta}\hat{\tau} + \frac{1-cos\theta}{\theta^2}\hat{\tau}^2 \\ = I + ( 1 - \frac{\theta^2}{3!} + \frac{\theta^4}{5!} + \cdot\cdot)\hat{\tau} + (\frac{1}{2!} - \frac{\theta^2}{4!} + \frac{\theta^4}{6!} + \cdot\cdot)\hat{\tau}^2 \\ = I + \hat{\tau} + \frac{1}{2!}\hat{\tau}^2 + {\frac{1}{3!}\hat{\tau}^3 + \cdot \cdot} \\ = exp(\hat{\tau})

2번째 행의 $sin\theta$ 와 $cos\theta$ 를 테일러 급수로 만들고 정리하면 나온다.
3번째 행은 $\tau = |\tau|u = \theta u \;\;(\theta := |\tau|)$ 으로부터 아래의 정리한 결과로부터 나온다.

\theta^2 = \tau^T\tau \\ (\hat{\tau})^{2i+1} = (-1)^i \theta^{2i} \hat{\tau} \\ (\hat{\tau})^{2i+2} = (-1)^i\theta^{2i}\hat{\tau}^2

4번째 행은 $e^x$ 의 테일러 급수의 정의로부터 정리된다.

이처럼 3차원 회전행렬도 exponential 형태로 만들 수 있다.
그렇다면 그림은 그릴 수 없지만 tangent space의 리 대수는 다음과 같을 것이다.

\hat{\tau} = \tau_x \begin{bmatrix} 0 & 0 & 0 \\ 0 & 0 & -1 \\ 0 & 1 & 0 \\ \end{bmatrix} + \tau_y \begin{bmatrix} 0 & 0 & 1 \\ 0 & 0 & 0 \\ -1 & 0 & 0 \\ \end{bmatrix} + \tau_z \begin{bmatrix} 0 & -1 & 0 \\ 1 & 0 & 0 \\ 0 & 0 & 0 \\ \end{bmatrix}

exp 연산자를 진행했던 과정을 반대로 하면 log 연산자가 된다.

Exponential Mapping의 파생 과정

위가 여러 리 군 중 일부에 대한 실제 계산 과정이라면 이 다음은 모든 리 군에 대해서 성립하는 것에 대한 증명이다.
(inverse 대신에 transpose를 사용해도 동일한 결과)

R(t)R(t)^{-1} = I

양변을 미분하면 아래와 같다.

R'(t)R(t)^{-1} + R(t)R(t)'^{-1} = 0 \\ R'(t)R(t)^{-1} = -R(t)R(t)'^{-1} \\ R'(t)R(t)^{-1} = -(R(t)'R(t)^{-1})^{-1}

즉, $R'R^{-1}$ 는 skew-symmetric matrix이다. 이는 다시 말하면 임의의 리 대수라고 볼 수 있다.

R'(t)R(t)^{-1} = \hat{\tau}

양변의 우측에 R을 붙이면 $R^{-1}R=I$ 에 의해서 다음과 같이 정리된다.

\\ R'(t) = \hat{\tau}R(t)

리 군인 R의 기울기는 tangent space를 얘기한다.

lie algebra의 정의가 identity에서의 tangen space(lie algebra)라고 했다.
따라서 t = 0일 때 R(0) = I로 설정하는 경우 다음과 같이 된다.

R'(0) = \hat{\tau}

즉, 해당 공간이 lie algebra 공간이 된다.

$R(t) = e^{\hat{\tau}t}R_0$ 라고 가정을 해보자. ( $R_0$ 는 초기 조건 행렬이다.)
(이렇게 가정되는 이유는 $R'(t)=\hat{\tau}R(t)$ 에서 Continuous time을 Discrete time으로 바꾼 것이다. 양변 적분하고, t=0 조건을 넣어주면 된다.)

그리고 이를 t에 대해서 미분하면 다음과 같다.

R'(t) = \hat{\tau}e^{\hat{\tau}t}R_0

lie algebra의 정의가 identity에서의 tangen space(lie algebra)라고 했다.
따라서 t = 0일 때 R(0) = I로 설정하는 경우 다음과 같이 된다.

R'(0) = \hat{\tau}

즉 위에서 나왔던 수식과 동일하므로 우리는 lie algebra에서 $R = e^{\hat{\tau}}$ 로 설정할 수 있다.

hat 연산자와 vee 연산자

회전 행렬의 리 대수는 skew-symmetric matrix이다.
즉, 3차원 회전이라고 가정하면 아래와 같은 형태가 된다.

\hat{\tau} = \begin{pmatrix} 0 & -\tau_3 & \tau_2 \\ \tau_3 & 0 & -\tau_1 \\ -\tau_2 & \tau_1 & 0 \\ \end{pmatrix}

따라서 3개의 변수만으로, 회전행렬을 리 대수로 바꾸는 경우를 표현할 수 있다.

hat( $\hat{\tau}$ ) 연산자는 3차원 벡터 $\tau$ 를 3x3 skew-symmetric matrix로 변환하는 연산자이고, vee( $\check{\tau}$ ) 연산자는 3x3 skew-symmetric matrix를 3차원 벡터로 변환하는 연산자이다.

리 대수의 더하기 연산자, 빼기 연산자

+와 -는 리 군에서 정의된 연산으로, 리 대수를 리 군과 리 대수의 관계와 맞게끔 새롭게 +, - 연산자를 새롭게 정의해야 된다.
그런데 리 대수의 경우 +와 -에서 교환 법칙이 성립하지 않기 때문에 우측 연산자와, 좌측 연산자를 별개로 정의해줘야 한다.
또한 리 대수의 연산임을 나타내기 위해 +, -를 각각 $\oplus, \ominus$ 로 정의한다.

right- $\oplus$ : $Y = X \oplus \;^X\tau := X\cdot Exp(^{\;^X \tau}) \in \boldsymbol{M}$

좌측 항은 리 군, 우측 항은 리 대수로 계산되어 리 군이 결과로 나온다. 따라서 Manifold(리 군)에 값이 존재하게 된다.
$\oplus$ 의 정의는 (identity의 tangent space가 아닌) X의 tangent space에서 $^X\tau$ 벡터만큼 이동하는 것이다. 여기서 위첨자로 X를 붙이는 것은 X의 tangent space를 의미한다. Identitiy 위치의 경우 $^\varepsilon\tau$ 로 표기한다.

right- $\ominus$ : $\;^X\tau = Y\ominus X := Log(X^{-1}\cdot Y) \in \boldsymbol{T_X M}$

좌측 항과 우측항 모두 리 군이고, 계산 결과는 tangent space(리 대수)에 값이 나온다.
$\ominus$ 의 정의는 X의 tangent space에서 X에서부터 Y의 까지의 lie algebra에서의 리 대수 값이다. 따라서 X를 log 매핑한 위치로부터의 리 대수가 된다.

lie algebra는 identity에서의 tangent space를 얘기한다고 했는데, X의 tangent space에서의 lie algebra vector라는 말이 나오는게 모순으로 느껴진다. 하지만 이것이 성립하는 이유는 exponential 함수와 log 함수(exponential 함수의 역함수)으로 matrix multiplication 가능하기 때문이다.
예를들어 Identity에서의 회전 행렬 $R_X$ 가 있다고 하자. 이를 lie algebra (tangent veector)로 표현하면 $^\varepsilon\tau_{X}$ 이다.
X의 tangent space에서 Y라는 곳으로 이동하는 임의의 tangent vector $^X\tau_Y$ 가 있다고 하자.
원래는 identity space에서만 정의되므로 $^X\tau_Y$ 는 존재할 수 없지만 exponential 함수에 의해서 $R_X R_Y$ 인 matrix multiplication이 가능하다. ( $R_Y$ 는 X space에서 Y space로 가는 회전행렬로 정의)

따라서 $R_X R_Y$ 로 X space를 거쳐서 Y space로 갔는데 $R_X R_Y$ 를 log함수로 identity space에 정의된 tangent vector $^\varepsilon R_Y$ 로 정의할 수 있으므로 X에서의 tangent space라는 것을 정의할 수 있게 된다.
다만 $^\varepsilon\tau_Y \neq ^X\tau_Y$ 이다. 따라서 $adj_X(^X\tau_Y)$ = $^\varepsilon\tau_Y$ 라는 adjoint operation을 사용해야 한다. 이는 Adjoint 섹션에서 설명한다.

우측 연산자의 설명을 보면 모두 X의 tangent space를 얘기한다. 이와 반대로 좌측 연산자는 Identity에서의 tangent space에서 출발하는 연산자를 얘기한다.

left- $\oplus$ : $Y = \;^\varepsilon\tau \oplus X := Exp(^\varepsilon\tau)\cdot X \in \boldsymbol{M}$

좌측 항은 리 대수가 되고, 우측 항은 리 군이다. 계산 결과는 Manifold 안의 원소(리 군)가 된다.
Identity 접점에서 리 대수 $^\epsilon\tau$ 만큼 이동을 한 것을 다시 리 군으로 갖고와서 행렬 연산을 진행한다.

left- $\ominus$ : $^\varepsilon \tau = Y \ominus X := Log(Y\cdot X^{-1}) \in \boldsymbol{T_\varepsilon M}$

좌측 항과 우측 항 모두 리 군이다. 그리고 계산 결과는 (Identity의 접점인) Tangent Space에 존재하여 Identity 접점의 위치에서의 리 대수가 된다.
$Y \cdot X^{-1}$ 을 계산한 결과인 리 군을 Z라고 보자. 그럼 $log(Z)$ 인데 $Z = exp(\hat{\tau})$ 로 $\varepsilon \oplus\tau$ 로 해석할 수 있으므로 Identity 접점 위치에서의 리 대수가 된다.

정리하면 우측 연산자는 특정 리 군에서의 tangent space에서 출발하는 리 대수 / 리 군이고,
좌측 연산자는 Identity의 접점에서 출발하는 리 대수 / 리 군이다.

$^X\tau$ 를 local frame이라고 부르며, $^\varepsilon\tau$ 를 global frame이라고 부른다.
여기서 유의하고 넘어갈 점은 $^X\tau \neq \;^\varepsilon \tau$ 인 점이다. (교환 법칙이 성립하지 않으므로)

회전 행렬의 리 대수가 skew-symmetric matrix인 이유

회전 행렬의 리 대수가 skew-symmetric matrix인 이유는 회전 변환의 기하학적 성질로 인해서이다.

lie algebra가 항등원에서의 tnagent space이다.
Manifold가 극소적인 범위에서 유클리드 공간을 따르기 때문에 리 대수를 tangent space의 항등원의 접점를 원점으로 두는 위치 벡터로 해석할 수 있다.

이러한 위치 벡터 뿐만 아니라 속도라는 개념으로 해석이 가능하다.
리 대수 각각을 점으로 두었을 때 점에서의 속도를 다음과 같이 근사하여 표현할 수 있다.
$\lim_{t->0} \frac{R-I}{t}$

3차원 회전을 예로 들어보자.
그러면 항등원은 아래와 같이 될 것이다.

I = \begin{bmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \\ \end{bmatrix}

그럼 각 열은 basis 벡터일 텐데 아래와 같이 접 평면에 대한 matrix로 표현할 수 있을 것이다.

Identity Matrix의 각 열에서의 평면은 다음과 같을 것이다.

T_{x}M = \begin{bmatrix} 0\\ a\\ b\\ \end{bmatrix} \\ \; \\ T_{y}M = \begin{bmatrix} c\\ 0\\ d\\ \end{bmatrix} \\ \; \\ T_{z}M = \begin{bmatrix} e\\ f\\ 0\\ \end{bmatrix}

즉, 3차원의 행렬은 다음과 같은 형태로 보이는 것을 볼 수 있다.
하지만 여전히 skew-symmetric이 성립되는 것은 아니다.

$exp(\hat{\tau})$ 는 lie algebra의 원점에서 탄젠트 벡터 $\tau$ 만큼 이동하는 것으로 해석할 수 있다고 위에서 얘기했다. 즉, 회전은 $exp({\hat{\tau}})$ 에 대한 테일러 급수로 나타낼 수 있다. 그런데 시간 t에 대해 0에 가깝게 테일러 급수로 $exp(\hat{\tau}t)$ 이와 같이 표현할 수 있을 것이다.

R = exp(\hat{\tau}t) = I + \hat{\tau}t + \frac{1}{2!}(\hat{\tau}t)^2 + \frac{1}{3!}(\hat{\tau}t)^3 + \cdot\cdot

다만 $\lim_{t->0}$ 에 가깝기 때문에 2차항까지만 근사를 하겠다.

R = exp(\hat{\tau }t) = I + \hat{\tau}t

$R^TR = I$ 이 성립하므로 아래와 같이 나타낼 수 있다.

R^TR = (I+\hat{\tau}t)^T(I+\hat{\tau}t) = (I + (\hat{\tau}t)^T)(I+\hat{\tau}t) = I + (\hat{\tau}^T+\hat{\tau})t + \hat{\tau}^T\cdot \hat{\tau}\cdot t^2

$t^2$ 항은 t가 0에 가까우므로 무시할 수 있다.
따라서 $\hat{\tau}^T+\hat{\tau} = 0$ 으로 되어야 하고, $\hat{\tau} = -\hat{\tau}^T$ 로 skew-symmetric matrix임이 증명된다.

다만, 회전 행렬은 제약 조건으로 다음 조건도 만족해야 한다.

det(R)=1

이는 아래와 같은 이유로 똑같이 증명된다.

det(e^{\hat{\tau}t}) = det(e^{tr(\hat{\tau})t}) = det(e^{0}) = 1

따라서 회전행렬의 리 대수는 skew-symmetric matrix가 된다.
( $tr(\hat{\tau}) = 0$ 인 이유는 위의 그림에 의해서 확인할 수 있다.)

Adjoint Representation in lie group

$\oplus$ , $\ominus$ 연산자에서 말했 듯이 좌측 연산자와 우측 연산자는 교환법칙이 성립하지 않는다.
그리고 좌측 연산자는 identity의 tangent space에서 출발하고, 우측 연산자는 X에 해당하는 tangent space에서 출발하는지로 해석이 달라진다.

lie algebra는 리 군의 identity에서의 tangent space이다.
그리고 adjoint는 특정 리 군의 tangent space를 identity에서의 tangent space로 변경하는데 사용된다.
$\;^\varepsilon\tau \neq\;^X\tau$ 인 리 대수가 존재한다.

$\oplus, \ominus$ 에서 왼쪽으로 연산하냐, 오른쪽에 연산하냐에 따라서 identity의 tangent space인지, 특정 리 군에서의 tangent space인지가 분리된다고 했다.
수식적으로 생각해보면 어떤 다른 리 대수 $\;^\varepsilon\tau ,\;^X\tau$ 를 아래와 같이 같다라고 정의할 수 있을 것이다.

Exp(\;^\varepsilon\tau)X = XExp(\;^X\tau)

리 군 관점에서
identity의 tangent space에서 $\;^\varepsilon\tau$ 만큼 이동한 다음에 $Exp(\;^\varepsilon\tau)$ 로 어떠한 행렬을 만들고 X와 곱하는 것과,
X의 tangent space에서 $\;^X\tau$ 만큼 이동한 다음에 $Exp(\;^X\tau)$ 로 어떠한 행렬을 만들고 X와 곱하는 것은 똑같게 정의할 수 있다.
( $\tau$ 가 어떤 값인지는 모르지만, 한 쪽을 알면 다른 한 쪽을 알 수 있는 형태)
X는 역행렬이 존재할 수 있으므로 아래와 같이 정리할 수 있다.

\\ exp(\;^\varepsilon\hat{\tau}) = Xexp(\;^X\hat{\tau})X^{-1} \\ Xexp(\;^X\hat{\tau})X^{-1} = exp(X\;^X\hat{\tau}X^{-1}) \\ \;^\varepsilon\hat{\tau} = X \;^X\hat{\tau} X^{-1}

이게 무슨 뜻이냐면, 리 군(행렬)의 정의에 따라서 리 군 X를 역행렬을 곱해서 identitiy로 보내고, identity 위치에서의 tangent space에서 계산을 한 후에, 다시 X의 위치로 보내는데 이러한 변환이 성립하는 리 대수 값을 구할 수 있다는 것이다.
따라서 리 대수의 정의가 identity에서의 tangent space이지만, 임의의 리 군에서의 tangent space 또한 identity에서의 tangent space에서 출발하는 것과 동일한 효과를 낼 수 있다는 것이다.

2행의 경우 $exp(\;^X\hat{\tau})$ 를 테일러 급수를 통해서 변환하여 증명할 수 있다.

기호 또한 $Ad_X$ 를 통해 정의되며, 정리하면 다음과 같다.

Ad_X(\hat{\tau}) := X\hat{\tau}X^{-1} \\ \;^X\tau \to \;^\varepsilon\tau, Ad_X(\;^X\hat{\tau}) = \;^\varepsilon\hat{\tau}

지금까지의 내용을 응용하면 다음과 같이 정리할 수 있다.

X \oplus \;^X\tau = (Ad_X \;^X\tau) \oplus X \\ Ad_{X^{-1}} = Ad_X^{-1} \\ Ad_{XY} = Ad_X Ad_Y

optimization 작업을 할 때 좌측 연산을 사용할 때도 있고, 우측 연산을 사용할 때도 있다.
보통 좌측 연산자는 전역적인 데이터를 다룰 때 모든 rotation을 전역 좌표계에서 계산하고, 우측 연산자는 특정 지점에서의 국소적인 좌표계에서의 미소 변화에 초점을 둔다.

좌측 연산자(global frame)는 변환이 큰 범위 내에서 일어나며, 변환 후의 결과가 원래 위치와 다를 수 있다. 이는 비선형적 변환을 고려해야 한다는 점에서 복잡성이 증가한다. 이에 반해 우측 연산자(local frame)은 변환이 작은 범위 내에서 일어나므로 변환 후의 결과가 원래 위치와 가깝다.

정리하면 리 군의 adjoint representation은 리 군 G의 원소 $g \in G$ 가 리 대수 g의 원소 $\tau \in g$ 에 작용하는 방식이다.

왼쪽 자코비안 vs 오른쪽 자코비안

더하기 연산자와 빼기 연산자가 좌측, 우측에 따라서 달라지듯이 자코비안도 마찬가지다.
여기서 말하는 자코비안은 $function : lie\; group(M) -> lie\; group(N)$ 인 함수의 자코비안을 얘기한다.
즉, 리 대수의 함수가 아니라, 리 군에 대한 함수임을 유의하자.

right-jacobian

\frac{^X Df(X)}{DX} := \lim_{\tau\to0}=\frac{f(X\oplus\tau)\ominus f(X)}{\tau} = \lim_{\tau\to0}\frac{Log(f(X)^{-1}\cdot f(X\cdot Exp(\tau)))}{\tau} = \frac{\partial Log(f(X)^{-1}\cdot f(X\cdot Exp(\tau)))}{\partial\tau}|_{\tau=0} \in R^{n\times m}

right-jacobian은 우측 연산자에 맞춰서 $\tau$ 는 $\;^X\tau$ 이다.

left-jacobian

\frac{^\varepsilon Df(X)}{DX} := \lim_{\tau\to0}=\frac{f(\tau\oplus X)\ominus f(X)}{\tau} = \lim_{\tau\to0}\frac{Log( f( Exp(\tau) \cdot X) \cdot f(X)^{-1})}{\tau} = \frac{\partial Log( f( Exp(\tau) \cdot X) \cdot f(X)^{-1})}{\partial\tau}|_{\tau=0} \in R^{n\times m}

left-jacobian은 좌측 연산자에 맞춰서 $\tau$ 는 $\;^\varepsilon\tau$ 이다.

함수 f(x)를 리 군( $M$ )에서 또 다른 리 군( $N$ )으로 보내는 함수라고 하자. (ex> M : Dim(3), N : Dim(2))
함수 f(x)의 식을 1차 테일러 근사한다고 하면 우측/좌측 연산자에 따라서 다음과 같이 2가지로 쓸 수 있다. ( $\tau$ 가 0에 가까운 경우)

f(X\oplus \;^X\tau) \approx f(X)\oplus(\frac{\;^XDf(X)}{DX}\;^X\tau) \in N

f(\;^\varepsilon\tau \oplus X) \approx (\frac{\;^\varepsilon Df(X)}{DX}\;^\varepsilon \tau) \oplus f(X) \in N

위 식에서 가로쳐져 있는 부분은 위의 그림에서의 초록색 실선의 역할을 한다. 즉 아래의 리 대수로 각각 표현할 수 있다.

(a) \;\;\;\;^{f(X)}\sigma = \frac{\;^X Df(X)}{DX} \;^{X}\tau \\ \; \\ \; (b) \;\;\;\;^\varepsilon\sigma = \frac{\;^\varepsilon Df(X)}{DX} \;^\varepsilon\tau

그리고 Adjoint에서 말했듯이 특정 리 군의 원소에 해당하는 tangent space를 identity의 tangent space로 Ad 연산자를 통해 옮길 수 있다.

(c) \;\;\;\;^\varepsilon\tau = Ad_X\;^X\tau \\ \; \\ (d) \;\;\;\;^\varepsilon\sigma = Ad_{f(X)} \;^{f(X)}\sigma

(c), (d)를 (b)에 대입하면 다음과 같다.

Ad_{f(X)} \;^{f(X)}\sigma = \frac{\;^\varepsilon Df(X)}{DX}Ad_X\;^X\tau

(a)를 위의 식에 대입하면 아래와 같이 정리된다.

Ad_{f(X)} \frac{\;^X Df(X)}{DX} \;^{X}\tau = \frac{\;^\varepsilon Df(X)}{DX}Ad_X\;^X\tau \\\;\\\;\\ \frac{\;^\varepsilon Df(X)}{DX}Ad_X = Ad_{f(X)}\frac{\;^XDf(X)}{DX}

이처럼 left-right 자코비안은 M과 N의 adjoint로 표현할 수 있다.

만약 그림에서의 초록 점선과 같이 local frame to global frame에서의 자코비안과, global frame to local frame의 경우 f(x)의 식을 1차 테일러 근사한 것에 (c), (d)를 대입한 것과 같다.

\frac{\;^{\varepsilon}Df(X)}{\;^{X}DX} = \frac{\;^{\varepsilon}Df(X)}{\;^{\varepsilon}DX}Ad_X = Ad_{f(X)}\frac{\;^{f(X)}Df(X)}{\;^{X}DX}

\frac{\;^{f(X)}Df(X)}{\;^{\varepsilon}DX} = \frac{\;^{f(X)}Df(X)}{\;^{X}DX}Ad_{X}^{-1} = Ad_{f(x)}^{-1}\frac{\;^{\varepsilon}DY}{\;^{\varepsilon}DX}

그림을 보면 이해하기 쉽다.
함수를 먼저 미분을 하고서 특정 리군 위치로 이동할 것인지, 특정 리군 위치로 이동하고 함수를 미분할 것인지이라고 생각하면 된다.
자코비안을 리 군에서 리 군으로 이동시켜주는 함수라고 생각하면 편하다.
$\frac{^aD}{^bD} \;^bw$ 이면 b의 tangent space에 있는 리 대수(w)가 a의 tangent space로 이동한다고 보면된다.

f(X\oplus \;^X\tau) \approx f(X)\oplus(\frac{\;^XDf(X)}{DX}\;^X\tau) = f(X)\oplus(Ad_X^{-1}\frac{\;^{\varepsilon}Df(X)}{^XDX}\;^X\tau) \\=Ad_XAd_X^{-1}\frac{\;^{\varepsilon}Df(X)}{\;^XDX}\;^X\tau \oplus f(X)=\frac{\;^{\varepsilon}Df(X)}{\;^XDX}\;^X\tau \oplus f(X)

X에서 출발했으므로 1행에서 2행으로 넘어갈 수 있다.

f(\;^\varepsilon\tau \oplus X) \approx (\frac{\;^\varepsilon Df(X)}{DX}\;^\varepsilon \tau) \oplus f(X) = f(X) \oplus Ad_{f(x)}^{-1}(\frac{\;^\varepsilon Df(X)}{DX}\;^\varepsilon \tau) = f(X) \oplus (\frac{\;^{f(x)} Df(X)}{^{\varepsilon}DX}\;^\varepsilon \tau)

우측 oplus 연산자에 의해서 f(x)로부터 시작해야 하므로 $Ad_{f(x)}^{-1}$ 를 곱해서 넘겨야 된다.

리 대수를 통한 분산 계산

right- $\oplus,\ominus$ 에서의 covariance

X = \bar{X}\oplus\;^{X}\tau \\ \;^{X}\tau = X \ominus \bar{X} \in T_{\bar{X}}M

(local frame) $\bar{X}$ 의 tangent space에서 분산은 다음과 같이 정의한다.

\;^X\sum\;_X := E[\;^{X}\tau\;^{X}\tau^T] = E[(X\ominus\bar{X})(X\ominus\bar{X})^T] \in R^{m\times m}

이를 통해서 $\bar{X}$ 의 Manifolds에서 Gaussian 값으로 정의할 수 있다.
$X$ ~ $N(\bar{X},\sum\;_X)$

left- $\oplus,\ominus$ 에서의 covariance

X = \;^{\varepsilon}\tau\oplus\bar{X} \\ \;^{\varepsilon}\tau = X\ominus\bar{X} \in T_{\varepsilon}M

(global frame) identity의 tangent space에서 분산은 다음과 같이 정의한다.

\;^\varepsilon\sum\;_X := E[\;^{\varepsilon}\tau\;^{\varepsilon}\tau^T] = E[(X\ominus\bar{X})(X\ominus\bar{X})^T] \in R^{m\times m}

adjoint를 통해 두 covariance는 다음과 같이 표현할 수 있다.

\;^\varepsilon\sum\;_X = Ad_X\;\;^{X}\sum\;_X \; Ad_X^T

이와 마찬가지로 Jacobian을 통해서 함수의 propagation 또한 covariance를 구할 수 있다.
$f : M \to N$ 라고 하자.

\sum \;_{f(X)} \approx \frac{Df(X)}{DX}\sum\;_X\;\frac{Df(X)}{DX}^T \in R^{n\times n}

리 대수의 이산 적분

$X(t) = X_0\cdot Exp(vt)$ 는 상수(constant) 속도 $v \in T_{X_0}M$ 를 연속 시간으로 적분한 것과 같다.

만약 속도( $v_k \in T_{X_{k-1}}M$ )가 상수(constant)가 아닌 경우 다음과 같이 이산 시간으로 적분을 할 수 있다.

X_k = X_0 \cdot Exp(v_1\partial t_1) \cdot Exp(v_2\partial t_2) \cdot Exp(v_3\partial t_3) \cdot\cdot\cdot Exp(v_k\partial t_k) \\ = X_0 \oplus v_1\partial t_1 \oplus v_2\partial t_2 \oplus v_3\partial t_3 \cdot\cdot\cdot \oplus v_k\partial t_k

선 속도 v 뿐 아니라 각 속도 w로도 정의가 가능하다.

DIFFERENTIATION RULES ON MANIFOLDS

여기서부터 얘기하는 모든 Jacobian은 우측 자코비안을 얘기한다.
좌측 자코비안을 유도하는 방법은 위에서(자코비안 섹션) left-right 자코비안의 Adjoint 변환으로 바로 유도할 수 있다.
우측 자코비안을 여기서는 다음과 같이 정의하겠다.

J_X^{f(X)} := \frac{Df(X)}{DX}

the chain rule
$Y = f(X), Z=g(Y)$ 라 하자. 한 줄로 적으면 다음과 같을 것이다. $Z = g(f(X))$
이는 chain rule로 간단히 표현히 가능하다.

\frac{DZ}{DX} = \frac{DZ}{DY}\frac{DY}{DX} \\\;\\ or \\\;\\ J_X^Z = J^Z_YJ_X^Y

우측 자코비안을 통해 간단히 증명이 가능하다.

g(f(X\oplus\tau)) = g(f(X)\oplus J^Y_X\tau) = g(f(X))\oplus J^Z_YJ^Y_X\tau = g(f(X))\oplus J^Z_X\tau

Jacobian 섹션의 1차 테일러 급수를 통해서 나오는 것을 응용한 것이다. 이때 $\tau$ 는 0에 가까운 값이다.

좌측 자코비안도 다음과 같이 chain rule이 성립한다.

\frac{\;^{Z}DZ}{\;^{\varepsilon}DX} = \frac{\;^{Z}DZ}{\;^{Y}DY}\frac{\;^{Y}DY}{\;^{\varepsilon}DX} = \frac{\;^{Z}DZ}{\;^{\varepsilon}DU}\frac{\;^{\varepsilon}DU}{\;^{\varepsilon}DX}

\frac{\;^{\varepsilon}DZ}{\;^{X}DX} = \frac{\;^{\varepsilon}DZ}{\;^{Y}DY}\frac{\;^{Y}DY}{\;^{X}DX} = \frac{\;^{\varepsilon}DZ}{\;^{\varepsilon}DY}\frac{\;^{\varepsilon}DY}{\;^{X}DX}

마찬가지로 1차 테일러 급수의 응용하면 다음과 같이 옮길 수 있다.

g(f(\;^\varepsilon \tau \oplus X)) = g(f(X) \oplus \frac{\;^YDZ}{\;^{\varepsilon}DX}\;^\varepsilon\tau) = g(f(X)) \oplus \frac{\;^ZDZ}{\;^{Y}DY} \frac{\;^Y DY}{\;^{\varepsilon}DX} \;^\varepsilon\tau = g(f(X)) \oplus \frac{\;^ZDZ}{\;^{X}DX} \;^\varepsilon\tau

마찬가지로 $^\varepsilon\tau$ 이 0에 가까워야지 성립을 하며, 우측으로 Jcobian 형태가 되는 것은 $Ad_{f(x)}^{-1}$ , $Ad_{g(x)}^{-1}$ 로 우측으로 넘겨서 계산한 것이다. (Jacobian 세션 마지막 부분 참조)

Elementary Jacobian Block

(우측 연산자 기반)

1) Inverse

$f(X) = X^{-1}$

J^{X^{-1}}_X = \frac{^XDX^{-1}}{DX} = \lim_{\tau\to 0}\frac{f(X\oplus\tau)\ominus f(X)}{\tau} \\\;\\ := \lim_{\tau\to0}\frac{Log((X^{-1})^{-1}(XExp(\tau))^{-1})}{\tau} \\\;\\ = \lim_{\tau\to0}\frac{Log(XExp(-\tau)X^{-1})}{\tau} \\\;\\= \lim_{\tau\to0}\frac{X(-\tau)X^{-1}}{\tau} \\\;\\= -Ad_X

2행은 우측 자코비안 정의에 의해서 전개한 것이다.
4행은 $XExp(\tau)X^{-1} =Exp(X\tau X^{-1})$ 에 의해 전개된다.

(2) Composition

$f(X,Y) = XY$

J_X^{X\cdot Y} := \frac{^XD(X\cdot Y)}{DX}= \lim_{\tau\to 0}\frac{f(X\oplus\tau,Y)\ominus f(X,Y)}{\tau} = \lim_{\tau\to 0} \frac{Log((XY)^{-1}(XExp(\tau)Y))}{\tau} = \lim_{\tau\to 0} \frac{Log(Y^{-1}Exp(\tau)Y)}{\tau} = \lim_{\tau\to 0} \frac{(Y^{-1}\hat{\tau} Y)^\vee}{\tau}=Ad_Y^{-1}

J_Y^{X\cdot Y} := \frac{^YD(X\cdot Y)}{DY} = \lim_{\tau\to0}\frac{f(X,Y\oplus \tau)\ominus f(X,Y)}{\tau} = \lim_{\tau\to 0} \frac{Log( (XY)^{-1}(XYExp(\tau)) )}{\tau} = \lim_{\tau\to 0} \frac{Log(Exp(\tau))}{\tau} =I

(3) Jacobians of Manifold

Manifold의 (우측/좌측) 자코비안은 리 대수 요소를 리 군 요소로 변활할 때(lie algebra -> lie group)의 미분 동작을 나타내는데 사용한다.
해당 자코비안의 경우는 리 군마다 다르다. (ex> SO(2), SO(3), ..)

SO(2)에서는 자코비안이 identity이지만, SO(3)에서는 identity가 아니다. 이러한 차이는 Log/Exp Mapping이 비선형이여서 발생하는 문제라고한다. (정확히 이해x)

$f(X) = X = Exp(\tau)$ 로서 M의 right jacobian을 정의한다.

J_r(\tau) := J_\tau^{Exp(\tau)} = \frac{^\tau DExp(\tau)}{D\tau} \in R^{m\times m}

자코비안은 adjoint와 비슷하게 특정 리군의 tangent space에서 또 다른 특정 리 군의 tangent space로 이동하는 것과 같음을 위에서 보였었다.
여기서도 마찬가지이다.

Exp(\tau + \delta\tau) \approx Exp(\tau)Exp(J_r(\tau)\delta\tau)

좌항의 경우 X의 tangent space에서 $\delta\tau$ 만큼 이동시키고, Exponential Mapping으로 리 군으로 갖고온다.

$Exp(\tau)$ 와 $Exp(\partial\tau)$ 가 tangent space가 다를 것이다. 따라서 $\tau$ 에 대한 (리 대수 $\to$ 리 군 함수의) 자코비안을 통해서 $\delta\tau$ 를 $\tau$ 에 해당하는 tangent space로 옮겨야 한다. 그렇기에 자코비안을 붙여야( $Exp(J_r(\tau)\delta\tau)$ ) 된다.