[Linear algebra] 대각화 | 대각화란, 대각화 가능한 조건은 무엇일까? (1)

박경민·2025년 5월 15일

[Linear algebra]

목록 보기

1/12

Linear Algebra: 대각화 | 대각화란, 대각화 가능한 조건은 무엇일까?

현재 friedberg 책으로 선형대수를 공부하고 있는데, 앞부분 내용이 끝난 뒤 뒷부분 내용을 조금 더 천천히 정리하며 가고자 한다. 따라서 본 포스팅의 시리즈들에 속한 정의, theorem, 예시, 문제들은 Linear algebra 프리드버그 책을 따를 것이다. 물론 얻어간 직관이나 풀어쓴 서술들은 책에 기반하여 나의 이해로부터 작성되었다.

Chapter 5. Diagonalization 을 한국어로 쓰면 주로 '대각화' 라고 한다. 본 챕터의 핵심 개념이니, 여기서는 dignalizatation, 대각화 등을 번갈아 사용하겠다. 그렇다면 선형대수에서 diagonalization 이란 무엇일까? 또, 어떤 상항을 두고 '대각화 가능'하다고 할까? 만약 어떤 선형변환 또는 행렬이 대각화 가능하다면, 어떻게 할까? 아래 이어지는 내용들은 이에 답한다.

1. Eigenvalues and Eigenvectors

대각화를 이해하기 위해선 eigenvalues and eigenvectors 에 대한 이해가 필요하고, 이 eigenvalues and eigenvectors 는 대각화 또는 대각화가능에 대해 이야기할 때도 중요하지만 한국어로, 고윳값과 고유벡터라는 내용으로 그 자체로도 중요한 지위를 가진다. 위 그림에선 diagonalizable (대각화 가능) 하다는 것이 무엇인지부터 정의하고 있다. finite dimensional vector space V 위에서, 어떤 선형변환 T가 대각화 가능하다라고 하는 것은 그 선형변환의 matrix representation 을 적절한 basis 로 잡아서 diagonal matrix 로 표현할 수 있을 때 대각화 가능하다고 부른다. 너무 당연하다 또는 동어반복이지 않냐 느껴질 수 있겠지만, 아래는 좀 다르다. 구체적으로 잡아낸 basis 베타를 {v1, ..., vn} 으로 풀어 쓰면, 이 벡터들을 인풋처럼 넣고 선형 변환한 결과는, 그 벡터의 상수배에 불과하다.

이 사실이 왜 특이하냐고? 대부분의 선형 변환 (우리는 이전에 선형 변환이 matrix 를 곱하는 것이며, 사실상 matrix 그 자체로도 볼 수 있고, 이 직관을 가지는 게 선형대수에서 가장 중요하다고 했다.) 은 벡터의 크기와 방향 두 가지를 모두 다 바꾸기 때문이다. 그런데 주어진 vector v1 이 들어가서 상수배만 달고 나오는 것은, 크기만 바뀌고 방향은 그대로인 변환을 의미하며, 그것이 선형변환 T가 diagonalizable 일 때 가능함을 의미한다.

이때 벡터 v1, ...., vn 은 eigenvector (고유벡터) 라 하고, 달고 나오는 상수 d11, ..., dnn 은 eigenvalue (보통 람다i로 표기, 고윳값) 라 한다.

2. Diagonalizable 1~2

그렇다면 f.d.v.s (finite dimensional vector space) V위의 선형 연산자 T가 대각화 가능하다는 필요충분조건은 무엇일까? 사실 위의 정의 자체의 다른 말들을 잘 적는 것일 뿐이지만, 이 단원에서는 무엇이 필요충분조건인지, 대각화 가능하다는 것이 무엇을 implies 할 수 있고, 다른 무엇이 대각화 가능하다는 것을 implies 하는지 알아두는 것이 가장 핵심이 된다.

T 가 대각화가능하다는 것의 필요충분조건은, T의 eigenvectors 들로 구성된 V의 순서 기저가 존재하는 경우, 이다.
이러한 경우에는, 만약 잡아낸 기저 베타, 그리고 이 베타를 기저로 쓴 matrix rep. D이 있을 때, (diagonal) D의 ii 성분이 vi 에 대응하는 eigenvalue 가 된다.

아래의 증명은 어렵지 않으니 잘 읽어보자.

그러나 대각화 가능의 필요충분 조건은 이 외에도 더 많다. 앞으로 쏟아질 내용들을 잘 이해하고 정리해두는 게 중요하겠다. 다음 필요충분조건도 보자. 사실 같은 말이다!

T가 대각화가능하다는 것의 필요충분조건은, invertible matrix Q가 있어서 이들의 열이 A (T의 matrix rep.) 의 egienvectors 인 경우를 말한다.
왜 이런 새로운 matrix Q가 등장하냐면, Q^-1AQ = D 인 상황을 보자는 것이고, 이렇게 곱하면 D 가 자연스럽게 대각행렬이 되고 Dii 가 A의 i열에 해당하는 eigenvalue 가 되기 때문이다. 즉, A와 D는 similar 이다.

3. Eigenvalue, Eigenvector 찾기

그렇다면 eigenvalue 와 eigenvector 를 찾는 방법은 무얼까? 실제로 nxn 행렬이 주어질 때, 일반적인 경우에는 eigenvalue 를 먼저 찾고, 그리고 이에 대응하는 eigenvector 를 찾게 되는데, 다음을 보자.

A의 고윳값 람다는 det(A-lambdaI) = 0 일 때 고윳값이다.
아래의 증명을 보자. 고윳값이 있다면, v에 선형변환을 취한 Av 는 상수배 람다v로 쓸 수 있고, 이를 v를 통해 묶어내면 된다.
그리고 determinant 를 양변에 취하면 된다. v는 우리가 0이 아니라고 가정했으므로, 따라서 앞부분의 determianant 가 0이 되는 람다를 찾아주면 된다.
이때 A에서 대각성분에 대해 각각 람다 = t 를 빼준 행렬의 행렬식을 characteristic polynomial 이라 한다. 줄여서는 char(t) 라 쓴다.
이 행렬식의 차수는 n이고, leading coefficient 는 (-1)^n 이다.
따라서 A행렬은 최대 n개의 서로 다른 eigenvalues 들이 있다. 뒤에서 이어지겠지만 이 경우 eigenvalues 에 대응하는 모든 eigenvector 들은 하나 이상이므로, 마치 dimension n인 vector space에서 모든 eigenvector 을 찾은 상황이 되고.. 정의에 따라 무조건 diagonalizable 하다. (n 개의 eigenvector 을 찾았다 => diagonalizable 하다. 의 관계를 기억해두면 요긴하게 사용할 수 있다.)

(간단한 eigenvalue 를 구하는 예시)

그렇다면 이를 기반으로 각각의 eigenvalues 에 대응하는 eigenvector 을 찾아보도록 하자. 아까의 식을 다시 꺼내오면 된다.

정의에 따라 우변이 무조건 0이 되어야 한다고 할 때, determinant 로 구한 람다를 실제 행렬에 대해 빼준다. 예를들어 람다 = 3을 eigenvalue 로 구했다면, A 행렬의 대각행렬에 대해 모두 3을 뺀다.
이 행렬과 vector v의 곱이 0이 되는 vector 가 eigenvector 이다. 따라서, eigenvector는 (A-람다I) 에 곱했을 때 0이 되게 하는 것, kernel of (A-람다i) 이다.
단 이때 eigenvector 는 nontrivial representation 이어야 한다. 즉, 0이 아닌데 곱해서 0이 가게 해줘야 한다.

Geometric Interpretation

Tv= lambda v 라는 것은 곧 vector v를 잡아 선형변환 시킨 결과가 v의 상수배인 경우를 말한다 했다. 따라서 그림이 다음과 같이 그려진다.

람다 = 1 을 기준으로 크면 기존 v보다 크기가 커지고, 작으면 작아진다.
0이면 원점.
음의 부호가 붙으면 반대 방향으로 간다.

연습문제 a.

linear operator 연산의 결과가 A에서 전치행렬 A transpose 로 갈 때 이 연산의 eigenvalues, eigenvectors 를 구하는 문제이다.

(풀이)

T(A) 의 결과는 행렬 A에 각 성분에 상수배를 취해준 것으로 이해할 수 있다고 했다. 따라서 = lambda A 이며, = transpose of A 이다. (문제 정의)
case 는 두 가지로, lambda a_12 = a21 인데 lambda a_21 = a12 이므로, lambda^2 a_12 = a12 이다. 따라서 lambda^2= 1 이다.
lambda = 1 인 경우에는 transpose of A = A 가 된다.
lambda = -1 인 경우에는 transpose of A = -A 가 된다.