11. 대각화 가능성

김재희·2021년 9월 3일
0

Linear Algebra

목록 보기
11/18

1. Intro

이전의 장에서 어떤 선형연산자가 대각화가능하기 위한 필요충분 조건은 해당 연산자의 고유벡터로 이루어진 순서기저가 존재해야 한다고 했다. 하지만 모든 선형연산자 혹은 행렬이 항상 대각화할 수 있는 것은 아니다. 이번에는 구체적으로 대각화가능을 판별하고, 고유벡터로 이루어진 순서기저를 찾는 방법을 다뤄보도록 하자.

2. 고유벡터, 고유공간

고유값은 특성다항식 f(t)=det(AtIn)f(t) = det(A - tI_n)의 근을 찾는 과정에서 발견할 수 있으며, 고유벡터는 고유값 λ\lambda를 이용해 Ax=λxAx = \lambda x를 통해 찾을 수 있다. (항상 이 방법으로 찾을 수 있는 것은 아니다.) 이렇게 찾은 고유벡터들을 모두 일차독립이다.

정리 1. 벡터공간의 선형연산자 TTTT의 서로 다른 고유값 λ1,λk\lambda_1, \dots \lambda_k를 생각해보자.각 i=1,ki = 1, \dots k에 대하여 λi\lambda_i에 대응하는 고유벡터로 이루어진 유한집합 SkS_k를 생각해보자. 각 SiS_i가 일차독립이면, S1SkS_1 \cup \dots S_k도 일차독립이다.

증명
수학적 귀납법을 통해 증명해보자.

(1) k=1k = 1인 경우 증명할 필요가 없다.
(2) k2k\geq 2인 경우를 생각해보자.
이때 k1k -1개의 서로 다른 고유값에 대해 위의 정리가 성립한다고 가정하자. 이때 전체 고유값은 kk개이므로 부분집합 Si={vi1,vi2,,vini}S_i = \{v_{i1}, v_{i2}, \dots ,v_{in_i}\}λi\lambda_i에 대응하는 일차독립인 고유벡터의 집합이라 해보자. 이때, 전체 집합 S=S1SkS = S_1 \cup \dots \cup S_k가 일차독립임을 증명하면 된다.

다음 식을 만족하는 임의의 스칼라 aija_{ij}를 생각해보자.

i=1kj=1niaijvij=0\displaystyle \sum^k_{i =1}\sum^{n_i}_{j =1} a_{ij}v_{ij} =0

즉, 각 λi\lambda_i에 대응하는 고유벡터의 선형결합을 나타낸 것이다.

이때 이에 대해 두가지 연산을 가할 것이다. 모두 특성다항식을 적용한 결과이다.

Ai=1kj=1niaijvij=0i=1kj=1niaijAvij=0i=1kj=1niaijλivij=0\begin{aligned} A\sum^k_{i =1}\sum^{n_i}_{j =1} a_{ij}v_{ij} &=0 \\ \sum^k_{i =1}\sum^{n_i}_{j =1} a_{ij}Av_{ij} &=0 \\ \sum^k_{i =1}\sum^{n_i}_{j =1} a_{ij}\lambda_iv_{ij} &=0\\ \end{aligned}

첫번째 연산 결과는 위와 같다. 단순히 행렬 AA를 가한 것이다.

λki=1kj=1niaijvij=0i=1kj=1niaijλkvij=0\begin{aligned} \lambda_k \sum^k_{i =1}\sum^{n_i}_{j =1} a_{ij}v_{ij} &=0 \\ \sum^k_{i =1}\sum^{n_i}_{j =1} a_{ij}\lambda_kv_{ij} &=0 \\ \end{aligned}

두번째 연산 결과는 위와 같다. 이번엔 λk\lambda_k를 가했다.

위 두 연산의 결과를 빼면 다음과 같은 수식이 도출된다.

i=1k1j=1niaij(λiλk)vij=0\begin{aligned} \sum^{k-1}_{i =1}\sum^{n_i}_{j =1} a_{ij}(\lambda_i-\lambda_k)v_{ij} &=0 \\ \end{aligned}

그런데 이미 S1Sk1S_1 \cup \dots \cup S_{k-1}이 선형독립이라 가정했기 때문에, i=1k1i = 1 \dots k-1에 대해서 aij(λiλk)=0a_{ij}(\lambda_i - \lambda_k) = 0이다. 이때, 각 고유값은 서로 다른 값이므로 λiλk0\lambda_i - \lambda_k \neq 0이므로, i=1k1i = 1 \dots k-1에 대하여 aij=0a_{ij}=0이 된다. 이는 자연스럽게 j=1nkakjvkj=0\sum^{n_k}_{j =1} a_{kj}v_{kj} = 0임을 알 수 있다. 이때, SkS_k도 선형독립이기 때문에, j=1nkj = 1 \dots n_k에 대하여 akj=0a_{kj} = 0이다.

그러므로 i=1ki = 1 \dots kj=1nij = 1 \dots n_i에 대하여 aij=0a_{ij} = 0이고, SS는 선형독립이다.

선형연산자 TT의 고유벡터가 서로 선형독립임을 이용하면, 한가지 따름정리가 추가적으로 나오게 된다.

따름정리. n차원 벡터공간의 선형연산자 TT가 서로다른 nn개의 고유값을 가지면 TT는 대각화가능하다.

증명
TT에 서로다른 nn개의 고유값, λ1λn\lambda_1 \dots \lambda_n이 있다고 가정할 때, 각 고유값에 대응하는 임의의 고유벡터 v1,vnv_1, \dots v_n을 선택하자. 이때 위의 정리 1에 의하여 {v1,,vn}\{v_1, \dots, v_n\}은 선형독립이고, dim(V)=ndim(V) = n이다. 결국 고유벡터로 만든 집합은 VV의 기저가 된다. 이는 결국 TT가 대각화가능하다는 것을 의미하게 된다.

지금까지 고유벡터와 대각가능화에 대해 살펴봤는데 좀 더 넓혀서 특성다항식과 대각가능성에 대해 살펴보도록 하자.

정의 1. 다음 조건을 만족하는 다항식 f(t) \in P(F)를 **F$ 위에서 완전히 인수분해된다**고 한다. 이때 스칼라 c,a1,,anFc, a_1, \dots , a_n \in F 중 같은 값이 있을 수 있다.

같은 값이 있다는 것은 중근을 의미하게 되고, 더 중요한 점은 체 FF 위에서 완전히 인수분해 되어야 한다는 점이다. 실수 공간에서 인수분해 되지 않는 특성다항식도 복소수 공간으로 옮기면 인수분해 될 수 있기 때문이다.

위의 정의를 이용해 특성다항식과 대각화가능성을 연결할 수 있다.

정리 2. FF-벡터공간 VV의 대각화가능한 선형연산자의 특성다항식으 FF 위에서 완전히 인수분해된다.

증명
n차원 벡터공간 VV의 대각가능한 선형연산자 TT에 대하여 [T]β=D[T]_\beta = D가 대각행렬이 되도록 하는 순서기저를 β\beta라 하면 DD는 다음과 같은 모양이 될 것이다.

이때 특성다항식 f(t)f(t)는 다음의 꼴이 된다.

f(t)=(λ1t)(λ2t)(λ3t)(lambdant)=(1)n(tλ1)(tλ2)(tλn)f(t) = (\lambda_1 - t)(\lambda_2 - t)(\lambda_3 -t)\dots(lambda_n-t) = (-1)^n(t-\lambda_1)(t-\lambda_2)\dots(t -\lambda_n)

결국 자연스레 특성다항식은 FF위에서 완전히 인수분해되는 것을 볼 수 있다. 이때 각 고유값들은 서로 다를 필요가 없는 것을 알 수 있다.
이렇게 고유값을 찾는 과정에서 중근이 발생하는 것과 연관된 개념이 하나 있다.

정의 2. 특성다항식이 f(t)f(t)인 선형연산자의 고유값 λ\lambda에 대하여, (tλ)k(t - \lambda)^kf(t)f(t)의 인수가 되도록 하는 가장 큰 자연수 kkλ\lambda의 중복도라 한다.

즉, λ=4\lambda = 4가 3번 중복되는 중근이라면, λ=4\lambda = 4의 중복도는 3이 된다.

지금까지 고유값 λ\lambda에 대응되는 고유벡터는 TλIT - \lambda I의 영공간에 속하는 영이 아닌 벡터임을 증명하는 과정이었다. 그렇다면 TλIT - \lambda I의 영공간은 어떻게 되어 있을까?

정의 3. 벡터공간 VV의 선형연산자 TT와 고유값 λ\lambda에 대하여, 다음집합 EλE_\lambdaλ\lambda에 대응하는 TT의 고유공간이라 한다.

Eλ={xV:T(x)=λx}=N(TλIv}E_\lambda = \{x \in V:T(x) = \lambda x\} = N(T- \lambda I_v\}

위 정의는 행렬에 대해서도 동일하게 적용된다. 그런데 EλE_\lambda는 당연하게도 고유벡터와 영벡터로 이루어져있게 된다. 즉, EλE_\lambda의 차원은 선형독립인 고유벡터의 최대 개수가 된다. 이는 결국 λ\lambda의 중복도와 EλE_\lambda의 차원이 연관되어 있음을 의미하게 된다.

정리 3. 유한차원 벡터공간 VV의 선형연산자 TT와 중복도가 mm인 고유값 λ\lambda에 대하여 adim(Eλ)ma \leq dim(E_\lambda) \leq m이다.

증명
EλE_\lambda의 순서기저를 확장하여 VV의 순서기저 β\beta를 만들자. 그리고 A=[T]βA = [T]_\beta에 대하여 λ\lambda에 대응하는 고유벡터를 viv_i라고 표기하도록 하자. 이때, AA 는 다음과 같은 꼴로 표현할 수 있다.

A=(λIpBOC)A = \begin{pmatrix} \lambda I_p & B \\ O & C \end{pmatrix}

이때 AA의 특성다항식은 다음과 같이 표현될 수 있다.

f(t)=det(AtIn)=det((λt)IpBOCtInp)=det((λt)Ip)det(CtInp)=(λp)pg(t)\begin{aligned} f(t) = det(A - tI_n) &= det\begin{pmatrix}(\lambda-t)I_p & B \\ O & C-tI_{n-p} \end{pmatrix}\\ &=det((\lambda -t)I_p) \cdot det(C - tI_{n-p})\\ &=(\lambda -p)^pg(t) \end{aligned}

즉, AA의 특성다항식 f(t)f(t)(λt)p(\lambda -t)^p을 인수로 가지게 된다. 이때 λ\lambda의 중복도는 최소 pp가 된다. dim(Eλ)=pdim(E_\lambda) = p이기 때문에, dim(Eλ)mdim(E_\lambda) \leq m이 된다.

결국 각 고유값의 중복도는 각 고유공간의 차원과 동일하다. 그리고 고유공간의 기저는 각 교유값에 대응하는 고유벡터를 통해 생성된다. 또한, 모든 고유공간의 기저의 합집합은 본래 선형변환의 기저를 이루게 되는 것이다. 이것이 대각화가 의미하는 바가 된다.

2. 대각화가능 판정

지금까지 다룬 내용을 정리하면 다음과 같다.

정리 4. 유한차원 벡터공간 VV의 선형연산자 TT에 대하여 TT의 특성다항식이 완전히 인수분해되고 , λ1,,λk\lambda_1, \dots , \lambda_k가 서로 다른 고유값일 때, 다음이 성립하게 된다.

  • TT가 대각화가능하기 위한 필요충분조건은 모든 ii에 대하여 λi\lambda_i의 중복도가 dim(Eλi)dim(E_{\lambda_i})와 같은 것이다.
  • TT가 대각화가능하고 각각의 ii에 대하여 βi\beta_iEλiE_{\lambda_i}의 순서기저일때, β=β1β2βk\beta = \beta_1 \cup \beta_2 \dots \cup \beta_kTT의 고유벡터로 이루어진 순서기저이다.

증명
ii에 대하여 mim_iλi\lambda_i의 중복도, di=dim(Eλi)d_i = dim(E_{\lambda_i}), n=dim(V)n = dim(V)라고 하자.
우선 TT가 대각화가능하다고 가정하고, TT의 고유벡터로 이루어진 VV의 기저를 β\beta로 표기한다. 각 ii에 대해 βi=βEλi\beta_i = \beta \cap E_{\lambda_i}로 각 고유값에 대응하는 고유벡터로 이루어진 집합이 될 것이다. 이때 βi\beta_i의 벡터의 개수를 nin_i로 표기해본다면, nidin_i \leq d_i일 수 밖에 없다. β1\beta_1는 차원이 did_i인 부분공간에서 일차독립인 부분집합이기 때문이다. 그리고 앞서 정리했듯이 dimid_i \leq m_i이다.

β\beta는 결국 n개의 벡터로 구성되어 있으므로 nin_i의 합은 n이 될 수밖에 없다. 이때, TT의 특성다항식의 차수 역시 각 고유값의 중복도의 합과 같기 때문에 mim_i의 합 역시 nn이 된다. 즉, 정리하자면 다음과 같다

n=i=1knii=1kdii=1kmi=nn =\sum^k_{i =1}n_i \leq \sum^k_{i =1}d_i \leq \sum^k_{i=1}m_i = n

위 식을 조금 정리하면 모든 ii에 대하여 (midi)0(m_i - d_i) \geq 0이므로, mi=dim_i = d_i이다. 그러므로 i=1k(midi)=0\sum^k_{i =1}(m_i -d_i) = 0이다.

여기서 조금더 나아가서, 역으로 증명해보도록하자. 즉, mi=dim_i = d_i일 때 대각화가능하고 각 고유공간의 기저의 합은 본 공간의 순서기저임을 보일 것이다.

ii에 대하여 EλiE_{\lambda_i}의 순서기저를 βi\beta_i라 하자. β=β1β2βk\beta = \beta_1 \cup \beta_2 \cup \dots \cup \beta_k라 하면, 이전의 정리에 의해 β\beta는 선형독립이다. 이때, di=mid_i = m_i임을 가정했으므로, β\betai=1kdi=i=1kmi=n\sum^k_{i =1} d_i = \sum^k_{i= 1}m_i =n개의 벡터로 구성되어 있다. 결국 β\betaVV의 고유벡터로 이루어진 순서기저이고, TT는 대각화가능하게 된다.

대각화가능 여부 판정법은 결국 두가지 조건으로 구성되게 된다.

  1. TT의 특성다항식이 완전히 인수분해된다.
  2. TT의 고육밧의 중복도가 nullity(TλI)nullity(T-\lambda I)와 같다.

또한 이를 대각화 자체와 이어서 생각해보면 대각화 가능한 n×nn\times n행렬 AA에 대하여 다음 식을 만족하는 행렬 Q,DQ, D는 항상 존재하게 된다.

D=Q1AQD = Q^{-1}AQ

이때, D의 대각성분은 AA의 고유값이 되고, QQ의 열벡터는 각 고유값에 대응하는 고유벡터가 된다. 또한, QQn×nn\times n의 가역행렬이다.

0개의 댓글