이번 포스트에서는 Symmetric matrix의 특별한 성질에 대해서 알아보도록 하겠습니다.
1) Symmetric Matrix
(1) Property of Symmetric Matrix
Definition : Symmetric Matrix
A matrix A is symmetric if A=AT
A와 AT가 같은 matrix를 symmetric matrix라고 합니다.
Theorem
If A is symmetric, then any two eigenvectors from different eigenspaces are orthogonal
일반적인 square matrix인 경우 다른 eigenspace에 속한 eigenvector는 linearly independent를 만족합니다. symmetric matrix는 linearly independent에 추가하여, orthogonal 조건까지 만족합니다.
이전 포스트에서, eigenvector와 eigenvalue를 이용하여 matrix를 diagonalize하는 방법에 대해 배웠습니다. A=PDP−1로 바꿀 때, P의 column이 eigenvector로 구성됩니다. Symmetric matrix의 경우 서로 다른 eigenspace끼리는 orthogonal하기 때문에, P의 column이 orthogonal(또는 orthonormal)하도록 설정할 수 있습니다. 즉, Symmetric matrix를 diagonalize할 때, P가 orthogonal matrix로 diagonalization을 진행할 수 있습니다.
이처럼, P가 orthogonal matrix으로 diagonalization이 가능한 경우, 해당 matrix는 Orthogonally diagonalizable이라고 합니다.
Definiton : Orthogonally diagonalizable
An n×n matrix A is said to be orthogonally diagonalizable if there are an orthogonal matrix P and a diagonal matrix D such that
A=PDPT
Theorem
An n×n matrix A is orthogonally diagonalizalbe if and only if A is symmetric matrix
위 정리를 통해 orthogonally diagonalizable한 matrix는 symmetric matrix뿐임을 알 수 있습니다.
(2) Spectral Decomposition
Theorem : The Spectral Theorem for Symmetric Matrix
An n×n symmetric matrix A has the following properties
A has n real eigenvalues, counting multiplicities.
The dimension of the eigenspace for each eigenvalue λ equals the multiplicity of λ as a root of the characteristic equation.
The eigenspaces are mutually orthogonal, in the sense that eigenvectors corresponding to different eigenvalues are orthogonal.
A is orthogonally diagonalizable.
n×n Symmetric matrix A는 다음 4가지 성질을 가지고 있습니다. 첫 째로, A는 중복도를 포함하여 n개의 실수 eigenvalue를 가집니다. 두 번째, 각각의 eigenvalue에 해당하는 eigenspace의 dimension은 characteristic equation에서 해당 eigenvalue가 가지는 중복도와 동일합니다. 두 번째 성질에 의해, symmetric matrix는 diagonalizable합니다. 이에 세 번째 성질을 추가하면, A는 orthogonally diagonalizable합니다.
이를 이용하여 symmetric matrix A는 여러개의 matrix로 분해가 가능합니다.
Spectral Decomposition
Suppose A is n×n symmetric matrix and A=PDP−1, where the columns of P are orthonormal eigenvectors u1,...,un of A and the corresponding eigenvalues λ1,...,λn are in the diagonal matrix D. Then,
지금까지 Symmetric matrix의 특별한 성질과 spectral decomposition에 대해 알아보았습니다. 다음 포스트에서는 quadratic form에 대해 알아보겠습니다. 질문이나 오류 있으면 댓글 남겨주세요! 감사합니다!
Appendix : Proof of Theorem
Theorem
If A is symmetric, then any two eigenvectors from different eigenspaces are orthogonal
Proof
A의 eigenvalue λ1,λ2에 대해 이에 해당하는 eigenspace에 속한 벡터를 각각 v1,v2라고 가정해봅시다. 그럼
Av1=λ1v1Av2=λ2v2
를 만족합니다. 첫 번째 식에 v2을 내적하면
Av1⋅v2=v2TAv1=λ1v1⋅v2
여기서 A는 symmetric matrix이기 때문에 위 식은 다음 식으로 변형됩니다.
Av1⋅v2=v2TATv1=v1⋅(Av2)=λ2v1⋅v2
따라서
λ1v1⋅v2=λ2v1⋅v2
가 성립합니다. 우변을 좌변으로 옮겨주면
(λ1−λ2)v1⋅v2=0
을 만족합니다. 현재 λ1,λ2는 다르므로, 양변을 나누어주면
v1⋅v2=0
을 만족하여, v1,v2는 orthogonal합니다.
Theorem
An n×n matrix A is orthogonally diagonalizable if and only if A is symmetric matrix
Proof
A가 symmetric matrix인 경우 서로 다른 eigenspace에 해당하는 eigenvector끼리 orthogonal한 성질을 이용하여 orthogonally diagonalizable한 것을 밝힐 수 있습니다.(만약 eigenspace의 dimension이 2 이상인 경우 Gram-Schumit process를 통해 orthonormal한 basis를 만들 수 있습니다.)
반대의 경우 또한, A가 orthogonally diagonalizable하면
A=PDPT
로 표현이 가능한데 이 때
AT=(PDPT)T=PDPT
가 되어 symmetric matrix임을 알 수 있습니다.
Theorem : The Spectral Theorem for Symmetric Matrix
An n×n symmetric matrix A has the following properties
A has n real eigenvalues, counting multiplicities.
The dimension of the eigenspace for each eigenvalue λ equals the multiplicity of λ as a root of the characteristic equation.
The eigenspaces are mutually orthogonal, in the sense that eigenvectors corresponding to different eigenvalues are orthogonal.
A is orthogonally diagonalizable.
Proof
Proof of 1.
1번 성질을 밝히기 위해서 symmetric matrix가 가지는 몇 가지 성질을 이용해야 합니다. 첫 번째로
x 벡터가 Cn에 속하고, q=xˉTAx일 때, q=qˉ, 즉 q는 실숫값을 가집니다. 이는
qˉ=xˉTAx=xˉˉTAx=xTAxˉ=(xTAxˉ)T=xˉTATx=xˉTAx=q
를 통해 알 수 있습니다. (conjugate vector와 matrix의 성질과, 현재 q가 C에 속한 값이므로 q=qT가 성립함을 이용해서 밝힐 수 있습니다. )
위 성질을 이용하면
Ax=λx
를 만족하는 x∈Cn인 nonzero vector가 존재하면, 이 때 λ는 실숫값을 가지고, x의 real part가 A의 eigenvector가 됩니다. 이는
xˉTAx=xˉTλx=λxˉTx
에서, 위 값이 실숫값을 가지기 때문에, 위 식과 위 식의 conjugate는 같습니다. 즉
λxˉTx=λxˉTx=λˉxTxˉ
을 만족합니다. 여기서, x는 nonzero vector이고, xˉTx=xTxˉ이므로 위 식이 성립되기 위해서는
λ=λˉ
를 만족해야 합니다. 즉 λ는 실숫값을 가져야 합니다. 해당 λ에 대응하는 eigenvector는 다음 식
Ax=λx
를 만족해야 합니다. 이 때 x=x1+ix2로, real part와 imaginary part로 나누면
Ax=Ax1+iAx2=λx1+iλx2,x1,x2∈Rn
와 같이 나타낼 수 있습니다. 여기서 양 변의 real part인
Ax1=λx1
을 만족하므로, x1은 λ에 해당하는 eigenvector가 됩니다.
따라서, symmetric matrix A의 eigenvalue는 무조건 실숫값을 가집니다.
Proof of 3
3번 째 성질의 경우 앞선 theorem을 이용하여 밝힐 수 있습니다.
proof of 4
4번 째 성질을 밝히기 위해서는 Scur factorization에 대해 알아야 합니다.
Schur factorization
Let A be an n×n matrix with n real eigenvalues, counting multiplicities, denoted by λ1,...,λn. Then, there are orthogonal matrix P and upper triangluar matrix R such that
A=PRPT
(일반적인 경우 λ1,...λn이 실수일 필요는 없으며, 만약 matrix나 vector가 복소수까지 다룬다면 해당 factorization은 orthogonal matrix P가 unitary matrix(P−1=Pˉ)로 변경됩니다.)
Schur factorization은 n×n matrix가 중복도를 포함하여 n개의 실수 eigenvalue를 가질 때, orthogonal matrix와 upper triangular matrix로 분해해주는 정리입니다.
첫 번째 성질에서 A가 symmetric이면
AT=PRTPT=PRPT=A
를 만족하기 때문에
RT=R
를 만족하게 되어, R은 diagonal matrix가 됩니다.
정리하면, Schur factorization을 이용하여, A를 orthogonal matrix P와 upper triangular matrix R로 분해가 가능한데, 이 때, A가 symmetric이므로, R은 diagonal matrix가 되어 A는 orthogonally diagonalizable합니다.
Proof of 2
4번 정리를 이용하면 쉽게 해결할 수 있습니다. 4번에서 symmetric matrix는 orthogonally diagonalizable하므로
A=PDPT=λ1u1u1T+⋯+λnununT
와 같이 작성할 수 있습니다. 이 때 λ1=⋯=λk=λ이면 위 식은
A=λu1u1T+⋯+λukukT+⋯+λnununT
다음과 같이 작성이 가능합니다. 여기서 {u1,...,uk}는 λ에 해당하는 eigenvector이고, orthogonal하기 때문에, λ에 대응되는 eigenspace의 basis가 됩니다. 즉 A의 characteristic equation의 solution λ의 중복도와 λ의 eigenspace의 dimension이 같게 됩니다.