7.1 Diagonalization of Symmetric Matrices

Jaehyun_onelion·2023년 3월 17일
0

선형대수학

목록 보기
38/42

이번 포스트에서는 Symmetric matrix의 특별한 성질에 대해서 알아보도록 하겠습니다.


1) Symmetric Matrix


(1) Property of Symmetric Matrix


Definition : Symmetric Matrix

A matrix AA is symmetric if A=ATA=A^T

AAATA^T가 같은 matrix를 symmetric matrix라고 합니다.


Theorem

If AA is symmetric, then any two eigenvectors from different eigenspaces are orthogonal

일반적인 square matrix인 경우 다른 eigenspace에 속한 eigenvector는 linearly independent를 만족합니다. symmetric matrix는 linearly independent에 추가하여, orthogonal 조건까지 만족합니다.

이전 포스트에서, eigenvector와 eigenvalue를 이용하여 matrix를 diagonalize하는 방법에 대해 배웠습니다. A=PDP1A=PDP^{-1}로 바꿀 때, PP의 column이 eigenvector로 구성됩니다. Symmetric matrix의 경우 서로 다른 eigenspace끼리는 orthogonal하기 때문에, PP의 column이 orthogonal(또는 orthonormal)하도록 설정할 수 있습니다. 즉, Symmetric matrix를 diagonalize할 때, PP가 orthogonal matrix로 diagonalization을 진행할 수 있습니다.

이처럼, PP가 orthogonal matrix으로 diagonalization이 가능한 경우, 해당 matrix는 Orthogonally diagonalizable이라고 합니다.


Definiton : Orthogonally diagonalizable

An n×nn\times n matrix AA is said to be orthogonally diagonalizable if there are an orthogonal matrix PP and a diagonal matrix DD such that

A=PDPTA=PDP^T

Theorem

An n×nn \times n matrix AA is orthogonally diagonalizalbe if and only if AA is symmetric matrix

위 정리를 통해 orthogonally diagonalizable한 matrix는 symmetric matrix뿐임을 알 수 있습니다.


(2) Spectral Decomposition


Theorem : The Spectral Theorem for Symmetric Matrix

An n×nn\times n symmetric matrix AA has the following properties

  1. AA has nn real eigenvalues, counting multiplicities.
  2. The dimension of the eigenspace for each eigenvalue λ\lambda equals the multiplicity of λ\lambda as a root of the characteristic equation.
  3. The eigenspaces are mutually orthogonal, in the sense that eigenvectors corresponding to different eigenvalues are orthogonal.
  4. AA is orthogonally diagonalizable.

n×nn\times n Symmetric matrix AA는 다음 4가지 성질을 가지고 있습니다. 첫 째로, AA는 중복도를 포함하여 nn개의 실수 eigenvalue를 가집니다. 두 번째, 각각의 eigenvalue에 해당하는 eigenspace의 dimension은 characteristic equation에서 해당 eigenvalue가 가지는 중복도와 동일합니다. 두 번째 성질에 의해, symmetric matrix는 diagonalizable합니다. 이에 세 번째 성질을 추가하면, AA는 orthogonally diagonalizable합니다.

이를 이용하여 symmetric matrix AA는 여러개의 matrix로 분해가 가능합니다.


Spectral Decomposition

Suppose AA is n×nn\times n symmetric matrix and A=PDP1A=PDP^{-1}, where the columns of PP are orthonormal eigenvectors u1,...,un\boldsymbol{u}_1, ..., \boldsymbol{u}_n of AA and the corresponding eigenvalues λ1,...,λn\lambda_1, ..., \lambda_n are in the diagonal matrix DD. Then,

A=PDPT=[u1...un][λ100λn][u1TunT]=[λ1u1...λnun][u1TunT]=λ1u1u1T++λnununT\begin{aligned} A =PDP^T &= \begin{bmatrix}\boldsymbol{u}_1& ... & \boldsymbol{u}_n\end{bmatrix}\begin{bmatrix}\lambda_1 & \cdots & 0 \\\vdots &\ddots & \vdots \\ 0 & \cdots & \lambda_n\end{bmatrix}\begin{bmatrix}\boldsymbol{u}_1^T \\ \vdots \\ \boldsymbol{u}_n^T\end{bmatrix} \\ &=\begin{bmatrix}\lambda_1\boldsymbol{u}_1 & ... & \lambda_n\boldsymbol{u}_n\end{bmatrix}\begin{bmatrix}\boldsymbol{u}_1^T \\ \vdots \\ \boldsymbol{u}_n^T\end{bmatrix} \\ &=\lambda_1\boldsymbol{u}_1\boldsymbol{u}_1^T + \cdots + \lambda_n \boldsymbol{u}_n\boldsymbol{u}_n^T \end{aligned}

This representation of AA is called a spectral decomposition of AA

Symmetric matrix는 eigenvalue와 이에 해당하는 orthonormal한 eigenvector들로 표현이 가능합니다. 다음 식에서 확인할 수 있는 점은 다음과 같습니다.

첫 번째, λkukukT\lambda_k \boldsymbol{u}_k\boldsymbol{u}_k^T은 rank가 1인 matrix입니다. 이는 rank의 정의와 해당 matrix product를 표현하면 쉽게 이해할 수 있습니다.

두 번째, ukukT\boldsymbol{u}_k\boldsymbol{u}_k^T matrix는 xRn\boldsymbol{x}\in \mathbb R^n{uk}\{\boldsymbol{u}_k\}가 basis인 subspace로 orthogonal projection시키는 matrix입니다. 즉

(ukukT)x(\boldsymbol{u}_k\boldsymbol{u}_k^T)\boldsymbol{x}

는 orthogonal projection of x\boldsymbol{x} onto the subspace spanned by uk\boldsymbol{u}_k입니다.


example

A=[7224]=[25151525][8003][25151525]A = \begin{bmatrix}7 & 2 \\ 2 & 4\end{bmatrix} = \begin{bmatrix}\frac{2}{\sqrt5} & -\frac{1}{\sqrt 5} \\ \frac{1}{\sqrt 5} & \frac{2}{\sqrt 5}\end{bmatrix}\begin{bmatrix}8 & 0 \\ 0 & 3\end{bmatrix}\begin{bmatrix}\frac{2}{\sqrt5} & \frac{1}{\sqrt 5} \\ -\frac{1}{\sqrt 5} & \frac{2}{\sqrt 5}\end{bmatrix}

다음 AA의 spectral decomposition은

A=8[2515][2515]+3[1525][1525]A=8\begin{bmatrix}\frac{2}{\sqrt 5} \\ \frac{1}{\sqrt 5} \end{bmatrix}\begin{bmatrix}\frac{2}{\sqrt 5} & \frac{1}{\sqrt 5}\end{bmatrix} + 3 \begin{bmatrix}-\frac{1}{\sqrt 5} \\ \frac{2}{\sqrt 5}\end{bmatrix}\begin{bmatrix}-\frac{1}{\sqrt 5} & \frac{2}{\sqrt 5}\end{bmatrix}

입니다.


지금까지 Symmetric matrix의 특별한 성질과 spectral decomposition에 대해 알아보았습니다. 다음 포스트에서는 quadratic form에 대해 알아보겠습니다. 질문이나 오류 있으면 댓글 남겨주세요! 감사합니다!


Appendix : Proof of Theorem


Theorem

If AA is symmetric, then any two eigenvectors from different eigenspaces are orthogonal


  • Proof

AA의 eigenvalue λ1,λ2\lambda_1, \lambda_2에 대해 이에 해당하는 eigenspace에 속한 벡터를 각각 v1,v2\boldsymbol v_1, \boldsymbol v_2라고 가정해봅시다. 그럼

Av1=λ1v1Av2=λ2v2A\boldsymbol{v}_1 = \lambda_1\boldsymbol{v}_1 \\ A\boldsymbol{v}_2 = \lambda_2\boldsymbol{v}_2

를 만족합니다. 첫 번째 식에 v2\boldsymbol{v_2}을 내적하면

Av1v2=v2TAv1=λ1v1v2A\boldsymbol{v}_1\cdot \boldsymbol{v}_2 = \boldsymbol{v}_2^TA\boldsymbol{v}_1 = \lambda_1\boldsymbol{v}_1\cdot\boldsymbol{v}_2

여기서 AA는 symmetric matrix이기 때문에 위 식은 다음 식으로 변형됩니다.

Av1v2=v2TATv1=v1(Av2)=λ2v1v2A\boldsymbol{v}_1 \cdot \boldsymbol{v}_2 = \boldsymbol{v}_2^TA^T\boldsymbol{v}_1 = \boldsymbol{v}_1\cdot(A\boldsymbol{v}_2) = \lambda_2\boldsymbol{v}_1\cdot\boldsymbol{v}_2

따라서

λ1v1v2=λ2v1v2\lambda_1\boldsymbol{v}_1\cdot\boldsymbol{v}_2 = \lambda_2\boldsymbol{v}_1\cdot\boldsymbol{v}_2

가 성립합니다. 우변을 좌변으로 옮겨주면

(λ1λ2)v1v2=0(\lambda_1-\lambda_2)\boldsymbol{v}_1\cdot\boldsymbol{v}_2 = 0

을 만족합니다. 현재 λ1,λ2\lambda_1, \lambda_2는 다르므로, 양변을 나누어주면

v1v2=0\boldsymbol{v}_1\cdot \boldsymbol{v}_2 =0

을 만족하여, v1,v2\boldsymbol{v}_1, \boldsymbol{v}_2는 orthogonal합니다.


Theorem

An n×nn \times n matrix AA is orthogonally diagonalizable if and only if AA is symmetric matrix


  • Proof

AA가 symmetric matrix인 경우 서로 다른 eigenspace에 해당하는 eigenvector끼리 orthogonal한 성질을 이용하여 orthogonally diagonalizable한 것을 밝힐 수 있습니다.(만약 eigenspace의 dimension이 2 이상인 경우 Gram-Schumit process를 통해 orthonormal한 basis를 만들 수 있습니다.)

반대의 경우 또한, AA가 orthogonally diagonalizable하면

A=PDPTA=PDP^T

로 표현이 가능한데 이 때

AT=(PDPT)T=PDPTA^T =(PDP^T)^T = PDP^T

가 되어 symmetric matrix임을 알 수 있습니다.


Theorem : The Spectral Theorem for Symmetric Matrix

An n×nn\times n symmetric matrix AA has the following properties

  1. AA has nn real eigenvalues, counting multiplicities.
  2. The dimension of the eigenspace for each eigenvalue λ\lambda equals the multiplicity of λ\lambda as a root of the characteristic equation.
  3. The eigenspaces are mutually orthogonal, in the sense that eigenvectors corresponding to different eigenvalues are orthogonal.
  4. AA is orthogonally diagonalizable.

  • Proof

  • Proof of 1.

1번 성질을 밝히기 위해서 symmetric matrix가 가지는 몇 가지 성질을 이용해야 합니다. 첫 번째로

x\boldsymbol x 벡터가 Cn\mathbb C^n에 속하고, q=xˉTAxq = \bar{\boldsymbol x}^TA\boldsymbol x일 때, q=qˉq=\bar q, 즉 qq는 실숫값을 가집니다. 이는

qˉ=xˉTAx=xˉˉTAx=xTAxˉ=(xTAxˉ)T=xˉTATx=xˉTAx=q\bar{q} = \overline{\bar {\boldsymbol x}^TA\boldsymbol x} = \bar{\bar{\boldsymbol x}}^T\overline{A{\boldsymbol x}} = \boldsymbol x^T A \bar{\boldsymbol x} = (\boldsymbol x^T A \bar{\boldsymbol x})^T = \bar{\boldsymbol x}^TA^T\boldsymbol x = \bar{\boldsymbol x}^TA\boldsymbol x = q

를 통해 알 수 있습니다. (conjugate vector와 matrix의 성질과, 현재 qqC\mathbb C에 속한 값이므로 q=qTq=q^T가 성립함을 이용해서 밝힐 수 있습니다. )

위 성질을 이용하면

Ax=λxA\boldsymbol{x} =\lambda\boldsymbol{x}

를 만족하는 xCn\boldsymbol{x} \in \mathbb C^n인 nonzero vector가 존재하면, 이 때 λ\lambda는 실숫값을 가지고, x\boldsymbol{x}의 real part가 AA의 eigenvector가 됩니다. 이는

xˉTAx=xˉTλx=λxˉTx\bar{\boldsymbol{x}}^TA\boldsymbol{x} = \bar{\boldsymbol{x}}^T\lambda\boldsymbol{x} = \lambda \bar{\boldsymbol{x}}^T\boldsymbol{x}

에서, 위 값이 실숫값을 가지기 때문에, 위 식과 위 식의 conjugate는 같습니다. 즉

λxˉTx=λxˉTx=λˉxTxˉ\lambda\bar{\boldsymbol{x}}^T\boldsymbol{x=}\overline{\lambda\bar{\boldsymbol{x}}^T\boldsymbol{x}} =\bar{\lambda} \boldsymbol{x}^T \bar{\boldsymbol{x}}

을 만족합니다. 여기서, x\boldsymbol{x}는 nonzero vector이고, xˉTx=xTxˉ\bar{\boldsymbol{x}}^T\boldsymbol{x}=\boldsymbol{x}^T\bar{\boldsymbol{x}}이므로 위 식이 성립되기 위해서는

λ=λˉ\lambda = \bar{\lambda}

를 만족해야 합니다. 즉 λ\lambda는 실숫값을 가져야 합니다. 해당 λ\lambda에 대응하는 eigenvector는 다음 식

Ax=λxA\boldsymbol{x} = \lambda\boldsymbol{x}

를 만족해야 합니다. 이 때 x=x1+ix2\boldsymbol{x} = \boldsymbol{x}_1 + i\boldsymbol{x}_2로, real part와 imaginary part로 나누면

Ax=Ax1+iAx2=λx1+iλx2,  x1,x2RnA\boldsymbol{x} = A\boldsymbol{x}_1 + iA\boldsymbol{x}_2 = \lambda\boldsymbol{x}_1 + i\lambda\boldsymbol{x}_2, \ \ \boldsymbol{x}_1, \boldsymbol{x_2} \in \mathbb R^n

와 같이 나타낼 수 있습니다. 여기서 양 변의 real part인

Ax1=λx1A\boldsymbol{x}_1 = \lambda \boldsymbol{x}_1

을 만족하므로, x1\boldsymbol{x}_1λ\lambda에 해당하는 eigenvector가 됩니다.

따라서, symmetric matrix AA의 eigenvalue는 무조건 실숫값을 가집니다.


  • Proof of 3

3번 째 성질의 경우 앞선 theorem을 이용하여 밝힐 수 있습니다.


  • proof of 4

4번 째 성질을 밝히기 위해서는 Scur factorization에 대해 알아야 합니다.


Schur factorization

Let AA be an n×nn\times n matrix with nn real eigenvalues, counting multiplicities, denoted by λ1,...,λn\lambda_1, ..., \lambda_n. Then, there are orthogonal matrix PP and upper triangluar matrix RR such that

A=PRPTA = PRP^T

(일반적인 경우 λ1,...λn\lambda_1, ...\lambda_n이 실수일 필요는 없으며, 만약 matrix나 vector가 복소수까지 다룬다면 해당 factorization은 orthogonal matrix PP가 unitary matrix(P1=PˉP^{-1}=\bar P)로 변경됩니다.)

Schur factorization은 n×nn \times n matrix가 중복도를 포함하여 nn개의 실수 eigenvalue를 가질 때, orthogonal matrix와 upper triangular matrix로 분해해주는 정리입니다.

첫 번째 성질에서 AA가 symmetric이면

AT=PRTPT=PRPT=AA^T = PR^TP^T = PRP^T = A

를 만족하기 때문에

RT=RR^T =R

를 만족하게 되어, RR은 diagonal matrix가 됩니다.

정리하면, Schur factorization을 이용하여, AA를 orthogonal matrix PP와 upper triangular matrix RR로 분해가 가능한데, 이 때, AA가 symmetric이므로, RR은 diagonal matrix가 되어 AA는 orthogonally diagonalizable합니다.


  • Proof of 2

4번 정리를 이용하면 쉽게 해결할 수 있습니다. 4번에서 symmetric matrix는 orthogonally diagonalizable하므로

A=PDPT=λ1u1u1T++λnununTA=PDP^T = \lambda_1\boldsymbol{u}_1\boldsymbol{u}_1^T + \cdots + \lambda_n \boldsymbol{u}_n\boldsymbol{u}_n^T

와 같이 작성할 수 있습니다. 이 때 λ1==λk=λ\lambda_1=\cdots= \lambda_k=\lambda이면 위 식은

A=λu1u1T++λukukT++λnununTA=\lambda\boldsymbol{u}_1\boldsymbol{u}_1^T + \cdots + \lambda\boldsymbol u_k\boldsymbol u _k^T + \cdots +\lambda_n \boldsymbol{u}_n\boldsymbol{u}_n^T

다음과 같이 작성이 가능합니다. 여기서 {u1,...,uk}\{\boldsymbol{u}_1, ..., \boldsymbol{u}_k\}λ\lambda에 해당하는 eigenvector이고, orthogonal하기 때문에, λ\lambda에 대응되는 eigenspace의 basis가 됩니다. 즉 AA의 characteristic equation의 solution λ\lambda의 중복도와 λ\lambda의 eigenspace의 dimension이 같게 됩니다.

profile
데이터 분석가 새싹

0개의 댓글