Linear Algebra - 4주차 1/2

Lisa·2020년 11월 3일
1

Linear Algebra

목록 보기
6/6
post-thumbnail

사실 3주차 포스팅 이후로 복습을 하지 않고 일주일 동안 버닝을 했더니 그 사이에 완강을 해버렸다. 복습 좀 제때 하자

DISCLAIMER: 아래 내용은 오로지 Coursera 강의를 토대로 제가 이해한 대로 정리한 것이기 때문에 부정확하거나 설명이 그닥 친절하지 않은 부분이 있을 수도 있습니다.


아인슈타인 표기법(Einstein summation convention)

아인슈타인 표기법(Einstein summation convention)은 행렬 공식을 간결하게 표현하는 또 다른 방법이라고 볼 수 있다. 대충 시그마를 생략하는 거라고 생각하면 될 것 같다.

다음과 같은 행렬 AABB가 있다고 하자.

A=[a11a12a1na21a22a2nan1an2ann]A=\begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{bmatrix}, B=[b11b12b1nb21b22b2nbn1bn2bnn]B=\begin{bmatrix} b_{11} & b_{12} & \cdots & b_{1n} \\ b_{21} & b_{22} & \cdots & b_{2n} \\ \vdots & \vdots \\ b_{n1} & b_{n2} & \cdots & b_{nn} \end{bmatrix}

이 두 행렬의 곱 ABAB 중에서 2열 3행에 위치한 (ab)23(ab)_{23}의 값은 다음과 같이 구할 수 있다.

(ab)23=a21b13+a22b23++a2nbn3(ab)_{23} = a_{21}b_{13} + a_{22}b_{23} + \dots + a_{2n}b_{n3}

아인슈타인 표기법을 이용하면 이 과정을 모든 원소에 대해서 다음과 같이 정리할 수 있다.

(ab)ik=j=1aijbjk=aijbjk(ab)_{ik} = \sum_{j=1}a_{ij}b_{jk} = a_{ij}b_{jk}


아인슈타인 표기법으로 내적(dot product) 공식을 간단히 할 수 있다.

u=[u1u2un]u = \begin{bmatrix} u_1 \\ u_2 \\ \vdots \\ u_n \end{bmatrix}, v=[v1v2vn]v = \begin{bmatrix} v_1 \\ v_2 \\ \vdots \\ v_n \end{bmatrix}가 있을 때, 이 두 벡터의 내적은 다음과 같이 표현할 수 있다.

uv=i=1uivi=uiviu \cdot v = \sum_{i=1}u_iv_i = u_iv_i


행렬곱과 역행렬을 이용한 기저변환

사영벡터를 이용하는 방법 뿐만 아니라, 행렬곱과 역행렬을 이용하여 기저변환을 하는 방법도 있다.

기저벡터가 e^1=[10]\hat e_1=\begin{bmatrix} 1 \\ 0 \end{bmatrix}, e^2=[01]\hat e_2=\begin{bmatrix} 0 \\ 1 \end{bmatrix}인 벡터공간이 있다고 하자. 또 다른 벡터공간(강의에서는 판다의 벡터공간이라고 부른다)의 기저벡터는 기존 벡터공간에서 표현했을 때 [31]\begin{bmatrix} 3 \\ 1 \end{bmatrix}, [11]\begin{bmatrix} 1 \\ 1 \end{bmatrix}라고 하고, 행렬 [3111]\begin{bmatrix} 3 & 1 \\ 1 & 1 \end{bmatrix}로 나타낼 수 있다.

판다의 벡터공간 안에서 정의된 벡터 [3212]\begin{bmatrix} \frac{3}{2} \\ \frac{1}{2} \end{bmatrix}가 있다. 이 벡터를 e^1\hat e_1, e^2\hat e_2로 정의된 기존 벡터공간의 값으로 변환하려면 다음과 같이 하면 된다.

[3111][3212]=[52]\begin{bmatrix} 3 & 1 \\ 1 & 1 \end{bmatrix}\begin{bmatrix} \frac{3}{2} \\ \frac{1}{2} \end{bmatrix} = \begin{bmatrix} 5 \\ 2 \end{bmatrix}

비슷한 방식으로 변환된 값을 다시 판다의 공간으로 변환을 하려면 [3111]\begin{bmatrix} 3 & 1 \\ 1 & 1 \end{bmatrix}의 역행렬을 곱해주면 된다.
12[1113][52]=[3212]\frac{1}{2}\begin{bmatrix} 1 & -1 \\ -1 & 3 \end{bmatrix}\begin{bmatrix} 5 \\ 2 \end{bmatrix} = \begin{bmatrix} \frac{3}{2} \\ \frac{1}{2} \end{bmatrix}



직교행렬(orthogonal matrix)과 전치(transpose)

전치(transpose)라는 것은 행렬을 대각선 기준으로 뒤집는 것을 의미하고, T를 사용하여 표현한다.

AijT=AjiA_{ij}^T = A_{ji}

[1234]T=[1324]\begin{bmatrix} 1 & 2 \\ 3 & 4 \end{bmatrix}^T = \begin{bmatrix} 1 & 3 \\ 2 & 4 \end{bmatrix}

벡터 a1a_1, a2a_2, \cdots, ana_n으로 이루어진 n×nn \times n 행렬 AA가 있다고 하자. AA를 구성하는 벡터들은 다음과 같은 성질을 갖는다.

aiaj=0 (ij)a_i \cdot a_j = 0 \space (i \neq j)
aiaj=1 (i=j)a_i \cdot a_j = 1 \space (i = j)

즉, AA의 벡터들은 모두 orthogonal하며 unit length를 가지므로 orthonormal basis set를 이룬다. 이러한 행렬을 직교행렬(orthogonal matrix)라고 부른다. 참고로 detA=±1det A = \pm 1이다.

직교행렬의 행과 열은 모두 orthonormal하다. 또한 orthonormal basis set을 전치(transpose)한 결과 값도 orthonormal하다.

직교행렬 AA의 전치행렬은 AA의 역행렬과 동일하다. (AT=A1A^T=A^{-1}ATA=IA^TA=I)


필기 첨부

profile
데이터 조아해오

0개의 댓글