이번 포스트에서는 diagonalization에 대해서 알아보겠습니다.
1) Diagonalization
(1) Efficiency of diagonal matrix
Diagonal matrix는 계산상의 이점을 가지고 있습니다.
example
D=[2003]
일 때,
D2=[220032], D3=[230033], Dk=[2k003k]
임을 알 수 있습니다.
example
D=⎣⎢⎡200030001⎦⎥⎤
일 때,
D−1=⎣⎢⎡21000310001⎦⎥⎤
인 것을 알 수 있습니다.
example
A=[7−421], P=[1−11−2], D=[5003]
A와 D는 similar합니다. 즉,
A=PDP−1
입니다. 여기서
A2=PDP−1PDP−1=PD2P−1,A3=PD2P−1PDP−1=PD3P−1,⋮Ak=PDkP−1=[1−11−2][5k003k][1−11−2]=[2⋅5k−3k2⋅3k−2⋅5k5k−3k2⋅3k−5k]
인 것을 알 수 있습니다.
위 예시들과 같이 diagonal matrix가 가지는 계산상의 이점이 많습니다. 따라서 A에 대해 설명할 때 A 대신 A와 similar한 diagonal matrix D를 이용하여 설명하는 경우가 많습니다. A를 PDP−1로 바꾸는 과정을 diagonaization이라고 합니다.
(2) Diagonalization
Definition : Diagonalization
A square matrix A is diagonalizable if A is similar to a diagonal matrix
A=PDP−1 for some invertible matrix P and some diagonal matrix D
어떤 matrix가 diagonalizable하다는 것은 A와 diagonal matrix D가 similar하다는 것을 뜻합니다.
어떤 matrix가 diagonalizable 여부를 확인할 수 있는 정리는 다음과 같습니다.
Theorem : The Diagonalization Theorem
An n×n matrix A is diagonalizable if and only if A has n linearly independent eigenvectors. In fact, A=PDP−1 with D a diagonal matrix, columns of P are n linearly independent eigenvectors of A, and diagonal entries of D are eigenvalues of A that correspond, respectively, to the eigenvectors in P.
In other words, A is diagonalizable if and only if there are enough eigenvectors to form a basis of Rn - eigenvector basis for Rn
n×n matrix A와 D가 similar하기 위한 조건은 linearly independent한 eigenvector가 n개가 되면 됩니다. 이 때, P,D를 특정할 수 있는데, D의 diagonal entry는 A의 eigenvalue가, P의 각 column은 D의 diagonal entry의 같은 index 위치의 eigenvalue에 해당하는 eigenvector가 됩니다.
example
A=⎣⎢⎡1−333−533−31⎦⎥⎤
A의 diagonalizable 여부를 확인하기 위해서 먼저 A의 eigenvalue와 eigenvector를 구해야 합니다.
det(A−λI)=∣∣∣∣∣∣∣1−λ−333−5−λ33−31−λ∣∣∣∣∣∣∣
위 matrix의 determinant를 계산하기가 어렵기 때문에, row operation을 통해 계산을 쉽도록 변형 후 determinant를 구하면
∣∣∣∣∣∣∣1−λ−333−5−λ33−31−λ∣∣∣∣∣∣∣=∣∣∣∣∣∣∣1−λ−303−5−λ−2−λ3−3−2−λ∣∣∣∣∣∣∣
=(−1)2(1−λ)∣∣∣∣∣−5−λ−2−λ−3−2−λ∣∣∣∣∣+(−1)3(−3)∣∣∣∣∣3−2−λ3−2−λ∣∣∣∣∣=(1−λ)((−5−λ)(−2−λ)+3(−2−λ))+3(3(−2−λ)−3(−2−λ))=(1−λ)(λ+2)(λ+2)=0
λ=−2,1
임을 알 수 있고, λ=−2의 multiplicity는 2입니다.
이제 eigenvalue를 계산하였으니 각각의 eigenvalue에 대한 eigenvector를 구해보면
λ=1인 경우
A−I=⎣⎢⎡0−333−633−30⎦⎥⎤
이 되어 (A−I)x=0의 solution을 augmented matrix를 통해 구하면
⎣⎢⎡1−333−533−31000⎦⎥⎤∼⎣⎢⎡100010−110000⎦⎥⎤
이 되어
x=x3⎣⎢⎡1−11⎦⎥⎤, x3 is free
가 됩니다.
λ=−2인 경우
A+2I=⎣⎢⎡3−333−333−33⎦⎥⎤
이 되어 (A+2I)x=0의 solution은
⎣⎢⎡3−333−333−33000⎦⎥⎤∼⎣⎢⎡100100100000⎦⎥⎤
이 되어
x=x2⎣⎢⎡−110⎦⎥⎤+x3⎣⎢⎡−101⎦⎥⎤ x2,x3 is free
가 됩니다.
λ=1일 때에 대응하는 eigenspace의 basis 원소의 개수가 하나, λ=−2일 때 대응하는 eigenspace의 basis 원소의 개수가 2개입니다. 이 때 서로 다른 eigenvalue에 해당하는 eigenvector는 linearly independent하므로, 위 matrix는 diagonalizable하고, P,D는 다음과 같습니다.
P=⎣⎢⎡1−11−110−101⎦⎥⎤, D=⎣⎢⎡100020002⎦⎥⎤
example
A=⎣⎢⎡2−434−633−31⎦⎥⎤
다음 matrix가 diagonalizable 여부를 확인하기 위해 먼저 eigenvalue를 구해보면
det(A−λI)=∣∣∣∣∣∣∣2−λ−434−6−λ33−31−λ∣∣∣∣∣∣∣
∣∣∣∣∣∣∣2−λ−434−6−λ33−31−λ∣∣∣∣∣∣∣=∣∣∣∣∣∣∣2−λ−2−λ34−2−λ3301−λ∣∣∣∣∣∣∣
=3∣∣∣∣∣−2−λ3−2−λ3∣∣∣∣∣+(1−λ)∣∣∣∣∣2−λ−2−λ4−2−λ∣∣∣∣∣ =(1−λ)(λ+2)2=0
이 되어
λ=1,−2
이고, λ=−2의 multiplicity는 2입니다.
이 때, λ=−2일 때의 eigenvector를 구해보면
A+2I=⎣⎢⎡4−434−433−33⎦⎥⎤
이 되어 (A+2I)x=0의 solution은
⎣⎢⎡4−434−433−33000⎦⎥⎤∼⎣⎢⎡100100010000⎦⎥⎤
이 되어
x=x3⎣⎢⎡−110⎦⎥⎤,x3 is free
가 되고,
λ=1일 때의 eigenvector를 구하면
A−I=⎣⎢⎡1−434−733−30⎦⎥⎤
가 되어,
⎣⎢⎡1−434−733−30000⎦⎥⎤∼⎣⎢⎡100010−110000⎦⎥⎤
x=x3⎣⎢⎡1−11⎦⎥⎤,x3 is free
가 됩니다. 지금 각각의 eigenvalue에 해당하는 eigenspace의 dimension이 1이므로, 총 합이 3이 되지 않아, 해당 matrix는 diagonalizable하지 않습니다.
이를 통해 모든 matrix가 diagonalizable하지 않다는 것을 알 수 있습니다.
다음 정리는 matrix의 diagonalizable 여부를 확인할 수 있는 정리입니다.
Theorem
An n×n matrix with n distinct eigenvalues is diagonalizable
n개의 서로 다른 eigenvalue를 가진 n×n matrix는 diagonalizable합니다. 이는 서로 다른 eigenvalue에 해당하는 eigenvector는 linearly independent한 것을 이용하면 쉽게 확인할 수 있습니다.
Theorem
Let A be an n×n matrix whose distinct eigenvalues are λ1,λ2,...,λp
- For 1≤k≤p, the dimension of the eigenspace for λk is less than or equal to the multiplicity of the eigenvalue λk
- The matrix A is diagonaliable if and only if the sume of the dimensions of the eigenspaces equals n. This happens if and only if
- The characteristic polynomial factors completely into linear factors
- The dimension of the eigenspace for each λk equals the multiplicity of λk
- If A is diagonalizable and Bk is a basis for the eigenspace corresponding to λk for each k , then the total collection of vectors in the sets B1,...,Bp forms an eigenvector basis for Rn
이 정리에서는 eigenvalue의 multiplicity에 따라 diagonalizable 여부를 확인할 수 있는 정리입니다.
만약 특정 eigenvalue의 multiplicity가 k인 경우, 해당 eigenvalue의 eigenspace의 dimension이 k를 만족할 때, 또한 이러한 조건을 모든 eigenvalue에 대해 성립할 때, 해당 matrix는 diagonalizable하게 됩니다. 만약 특정 eigenvalue의 multiplicity가 eigenspace의 dimension보다 클 때, 해당 matrix는 diagonalizable하지 않습니다.
위의 예시를 다시보면, 첫 번째의 예시는 λ=1일 때 eigenspace dimension이 1이었고, λ=−2일 때 eigenspace dimension이 2로 각각의 multiplicity와 같았기 때문에 diagonalizable하였고, 두 번째 예시는 λ=−2일 때의 multiplicity는 2였으나 eigenspace의 dimension이 1이었기 때문에 diagonalization이 불가능하였습니다.
example
A=⎣⎢⎢⎢⎡501−1054−200−30000−3⎦⎥⎥⎥⎤
해당 matrix가 diagonalizable 여부를 확인하기 위해 eigenvalue를 구하면 위 matrix는 triangular matrix이므로
λ=5,−3
이 되고, 각각의 multiplicity가 2가 됩니다.
λ=5일 때의 eigenvector를 구하기 위해 (A−5I)x=0을 풀면
⎣⎢⎢⎢⎡501−1054−200−30000−30000⎦⎥⎥⎥⎤∼⎣⎢⎢⎢⎡100001008−40016−4000000⎦⎥⎥⎥⎤
이 되어
x=x3⎣⎢⎢⎢⎡−8410⎦⎥⎥⎥⎤+x4⎣⎢⎢⎢⎡−16401⎦⎥⎥⎥⎤, x3,x4 is free
λ=−3일 때의 eigenvector를 구하기 위해 (A+3I)x=0을 풀면
⎣⎢⎢⎢⎡801−1084−2000000000000⎦⎥⎥⎥⎤∼⎣⎢⎢⎢⎡10000100000000000000⎦⎥⎥⎥⎤
이 되어
x=x3⎣⎢⎢⎢⎡0010⎦⎥⎥⎥⎤+x4⎣⎢⎢⎢⎡0001⎦⎥⎥⎥⎤, x3,x4 is free
이 됩니다. 이 때 각 eigenvalue의 multiplicity와 eigenspace의 dimension이 2로 같기 때문에 해당 matrix는 diagonalizable하고
A=PDP−1, P=⎣⎢⎢⎢⎡−8410−1640100100001⎦⎥⎥⎥⎤,D=⎣⎢⎢⎢⎡5000050000−30000−3⎦⎥⎥⎥⎤
가 됩니다.
지금까지 diagonalization에 대해서 알아보았습니다. 다음 포스트에서는 complex eigenvalue에 대해서 알아보겠습니다. 질문이나 오류 있으면 댓글 남겨주세요! 감사합니다!
Appendix : Proof of Theorem
Theorem : The Diagonalization Theorem
An n×n matrix A is diagonalizable if and only if A has n linearly independent eigenvectors. In fact, A=PDP−1 with D a diagonal matrix, columns of P are n linearly independent eigenvectors of A, and diagonal entries of D are eigenvalues of A that correspond, respectively, to the eigenvectors in P.
In other words, A is diagonalizable if and only if there are enough eigenvectors to form a basis of Rn - eigenvector basis for Rn
⇒
A=PDP−1⟺AP=PD
임을 밝히면 됩니다.
P : n×n matrix with column : v1,...,vn, D : diagonal matrix with λ1,...,λn이라고 합시다.
이 경우
AP=A[v1...vn]=[Av1...Avn]
가 되고
PD=[v1...vn]⎣⎢⎢⎡λ1⋮0...⋱⋯0⋮λn⎦⎥⎥⎤=[λ1v1...λnvn]
이 됩니다.
AP=PD[Av1...Avn]=[λ1v1...λnvn]
이 되고, 이는
Avj=λjvj
이므로, D의 diagonal entry는 eigenvalue, P의 column은 해당 위치의 eigenvalue에 해당하는 eigenvector가 됩니다. ㅇ
⇐
{v1,...,vn}이 linearly independent한 eigenvectors고, 각각의 eigenvector에 해당하는 eigenvalue를 λ1,...,λn라 하면
P=[v1...vn], D=⎣⎢⎢⎡λ1⋮0...⋱⋯0⋮λn⎦⎥⎥⎤
으로 P,D를 정의하면
PD=[λ1v1...λnvn]=[Av1...Avn]=AP
가 되어
PD=APA=PDP−1
가 성립하여 diagonalizable합니다.
Theorem
An n×n matrix with n distinct eigenvalues is diagonalizable
n개의 서로 다른 eigenvalue에 해당하는 eigenvector는 linearly independent합니다. 따라서 n개의 linearly independent한 eigenvector를 가지고 있기 때문에, diagonalizable합니다.