이번 포스트에서는 eigenvector와 eigenvalue에 대해 알아보겠습니다.
1) Eigenvecotrs and Eigenvalues
Definition : Eigenvecotrs and Eigenvalues
Let A be an n×n square matrix.
The eigenvector of A is a non-zero vector x such that
Ax=λx
for some scalar λ.
A scalar λ is called an eigenvalue of A if there is a nontrivial solution x of Ax=λx
x is called an eigenvector corresponding to λ
Eigenvector와 eigenvalue의 정의에서의 point는 다음과 같습니다. 첫 번째로, eigenvector와 eigenvalue는 square matrix에서 정의됩니다. 두 번째로, 다음 equation
Ax=λx
가 non-trivial solution이 존재할 때, 이 때 λ를 A의 eigenvalue라고 합니다. 마지막으로, 위 equation의 solution 중 zero vector를 제외한 x를 eigenvector corresponding to λ라고 합니다.
위 정의를 생각해보면, 다음
Ax=λx
가 nontrivial solution이 존재해야 eigenvalue와 eigenvector를 정의할 수 있습니다. 우변의 항을 좌변으로 넘겨 x로 묶으면
(A−λI)x=0
위 equation이 non-trivial solution을 가져야 eigenvector와 eigenvalue를 정의할 수 있습니다.
Eigenvector와 eigenvalue를 정의하기 위해서는 위 equation의 solution을 구해야 합니다. 즉, eigenvector corresponding to λ는
Nul(A−λI)
다음의 null space에서 zero vector를 제외한 vector가 됩니다. 여기서, zero vector를 포함한 다음 Nul(A−λI)를 eigenspace of A corresponding λ라고 합니다. 즉 λ에 대한 eigenspace에서 zero vector를 제외한 나머지 vector들이 λ에 대한 eigenvector입니다.
example
A=[1562], u=[6−5], v=[3−2]
에 대해서
Au=[−2420]=−4[6−5]=−4uAv=[−911]=kv
Au=−4u를 만족하기 때문에, −4는 A의 eigenvalue이고, 이 때 u는 eigenvector of A corresponding to −4가 됩니다. 이 때, u의 scalar multiple 역시 위 식을 만족하기 때문에, eigenvector가 되어, -4에 대한 모든 eigenvector와 zero vector를 모은 집합
Nul(A+4I)={ku∣k∈R}
을 eigenspace of A corresponding to −4라고 합니다.
한편, Av=kv이기 때문에, v는 eigenvector가 되지 않습니다.
example
A=[31−20], λ=2
A의 eigenvalue가 λ=2일 때, 2에 해당하는 eigenvector를 찾아봅시다. eigenvector는 다음 조건을 만족해야 합니다.
Ax=2x
이 식을 정리하면
(A−2I)x=0⇒[11−2−2]x=0⇒x=k[21], k∈R
가 됩니다.
example
A=⎣⎢⎡422−11−1668⎦⎥⎤, λ=2
A의 eigenvalue 중 하나가 λ=2입니다. 이 때 λ=2에 해당하는 eigenspace는
Ax=2x
를 만족하는 solution 집합입니다. 이는
(A−2I)x=0
를 만족하는 solution 집합이고 이는
Nul(A−2I)
와 같습니다. 이를 구하기 위해 위 matrix equation의 augmented matrix를 이용하면
⎣⎢⎡222−1−1−1666000⎦⎥⎤∼⎣⎢⎡100−2100300000⎦⎥⎤
이 되어
x=x2⎣⎢⎡2110⎦⎥⎤+x3⎣⎢⎡−301⎦⎥⎤, x2, x3 : free
가 되어
Nul(A−2I)=Span{⎣⎢⎡2110⎦⎥⎤,⎣⎢⎡−301⎦⎥⎤}
이 됩니다. 따라서 위 eigenspace의 basis는
{⎣⎢⎡2110⎦⎥⎤,⎣⎢⎡−301⎦⎥⎤}
입니다.
2. Properties of eigenvalues and eigenvectors
Eigenvalue와 eigenvector의 성질에 대해 알아보겠습니다.
Theorem
The eigenvalues of a triangular matrix are the entries on its main diagonal
Triangular matrix의 경우 eigenvalue를 바로 구할 수 있습니다. 대각 성분이 eigenvalue가 됩니다.
Theorem
If v1,...,vr are eigenvectors that correspond to distinct eigenvalues λ1,...,λr of an n×n matrix A, then the set {v1,...,vr} are linearliy independent.
서로 다른 eigenvalue로부터 나온 eigenvector들은 linearly independent합니다.
Theorem
A is not invertible if and only if one of eigenvalues of A is 0
0인 Eigenvalue를 적어도 하나 가진다면 A는 invertible하지 않습니다. 즉, invertible matrix의 eigenvalue는 0을 포함해서는 안됩니다.
다음 정리들의 증명은 appendix를 참고하시기 바랍니다.
Solution of xk+1=Axk
Eigenvector와 eigenvalue를 알고 있다면 다음 문제
xk+1=Axk
의 solution을 쉽게 구할 수 있습니다.
x1 을 λ에 해당하는 eigenvector라고 하면
x2x3⋮xk=Ax1=λx1=Ax2=λ2x1=Axk−1=λk−1x1
임을 알 수 있습니다.
지금까지 eigenvector와 eigenvalue에 대해 알아보았습니다. 다음 포스트에서는 characteristic equation에 대해 알아보겠습니다. 질문이나 오류 있으면 댓글 남겨주세요! 감사합니다!
Appendix : Proof of theorem
Theorem
The eigenvalues of a triangular matrix are the entries on its main diagonal
n×n upper triangular matrix A 를 다음과 같이 정의하면
A=⎣⎢⎢⎢⎢⎡a10⋮0∗a2⋮0⋯⋯⋱⋯∗∗⋮an⎦⎥⎥⎥⎥⎤
이 후 eigenvalue의 정의에 따라
Ax=λx
가 non-trivial solution을 가져야 합니다. 이는
(A−λI)x=0
이 non-trivial solution을 가져야 하는 것과 같습니다. 위 A−λI는
A−λI=⎣⎢⎢⎢⎢⎡a1−λ0⋮0∗a2−λ⋮0⋯⋯⋱⋯∗∗⋮an−λ⎦⎥⎥⎥⎥⎤
와 같이 정의되며, 위 matrix가 invertible하지 말아야 하므로, determinant가 0이 되어야 합니다. 이는
(a1−λ)(a2−λ)⋯(an−λ)=0
을 만족해야 합니다. 즉 A의 eigenvalue는 A의 diagonal entries입니다. 이는 lower triangular matrix에서도 똑같이 적용됩니다.
Theorem
If v1,...,vr are eigenvectors that correspond to distinct eigenvalues λ1,...,λr of an n×n matrix A, then the set {v1,...,vr} are linearliy independent.
{v1,...,vr}이 linearly dependent하다고 가정해봅시다. 그렇다면
c1v1+⋯+crvr=0
가 non trivial solution을 만족합니다. (즉 적어도 하나의 ci가 0이 아니면서 위 식을 만족합니다.) 이 때, 어떤 한 벡터는 그 벡터의 index보다 적은 index를 가지는 벡터들의 linear combination으로 표현이 됩니다. 즉
vj=d1v1+⋯+dj−1vj−1
을 만족하는 vj가 적어도 하나 존재합니다. 이를 만족하는 j 중 가장 작은 index를 p라고 하면
vp=d1v1+⋯+dp−1vp−1, ⋯(1)
를 만족하면서, index가 가장 작기 때문에, {v1,⋯,vp−1}는 linearly independent합니다. (1)의 양변에 A를 곱하면
Avp=d1Av1+⋯+dp−1Avp−1
인데, vi는 λi에 해당하는 eigenvector이므로
λrvp=d1λ1v1+⋯+dp−1λp−1vp−1 ⋯(2)
이 됩니다.
한편, (1) 양변에 λp을 곱하면
λpvp=d1λpv1+⋯+dp−1λpvp−1 ⋯(3)p
을 만족합니다. (2)식과 (3)식을 빼면
0=d1(λ1−λp)v1+⋯+dp−1(λp−1−λp)vp−1
가 성립합니다. 여기서 λj는 모두 다른 값이기 때문에, 앞의 coefficient 중 적어도 하나는 0이 아닙니다. 따라서
c1v1+⋯+cp−1vp−1=0
의 non-trivial solution이 존재합니다. 즉 {v1,⋯,vp−1}은 linearly dependent합니다. 여기서 모순이 발생하여 가정인 {v1,...,vr}이 linearly dependent가 틀린 가정이 됩니다. 따라서
{v1,...,vr}
은 linearly independent합니다.
Theorem
A is not invertible if and only if one of eigenvalues of A is 0
만약 A의 eigenvalue가 0이라면
Ax=0⋅x=0
이 non-trivial solution을 가진다는 것을 뜻합니다. 따라서 A는 not invertible합니다.