[Linear algebra] 케일리-해밀턴 정리 (1)
이번 포스팅에선, 케일리-해밀턴 정리에 대해 알아보자. 케일리-해밀턴 정리는, 정리 그 자체의 중요성만큼이나 정리로 이어지는데 사용되는 T-invariant subspace, T-cyclic subspace 개념이 다른 선형대수학 파트에서도 꾸준히 변형되고 응용되기에, 잘 봐두면 언젠가 요긴하게 쓰일 곳이 있을 것이다. 목표는 케일리-해밀턴 정리를 보이고 증명하는 것이지만, 이를 위해
- T-invariant subspace 정의, 예시
- T-cyclic subspace 의 정의, 예시
- 연습 문제
를 다시 되돌아 보는 걸로 하자!
1. T-invariant Subspace (Def, Ex)
T-invariant subspace 의 정의는 다음과 같다.

- T를 vector space V 위에서 linear operator 라 할 때, T-invariant subspace 라고 하는 것은 V 의 부분집합 W가 있어서 W의 어떤 원소를 잡아 T linear operator 의 인풋으로 넣어도 또다시 W의 원소가 튀어나온다는 것이다.
- 예시 1번을 보자. 0 (영, 영집합), V, kerT, ImT 는 모두 T-invariant subspace 의 예시가 된다.
- 0은 어떻게 선형변환해도 0이므로 T-invariant subspace 이다.
- V의 원소 v를 잡아 T 에 집어넣으면 T는 linear operator 이므로 또다시 V의 원소를 내놓을 것이다. 따라서 V 또한 T-invariant subspace 다.
- 마찬가지로 kerT, ImT 도 T-invariant subspace 가 된다.
- 여기서 하나 추가할 것은, eigenspace 또한 T-invariant subspace 가 된다. 왜냐고? Eigenspace 의 정의를 떠올려보면, V위에 선형 변환 T가 있어서, 원소 v를 잡아 대응시켜도 여전히 v의 상수배로만 나오는, 그때 eigenvalues 들에 대응되는 eigenvector 들이 span 하는 공간이라 했다.
- 따라서 Eigenspace 의 원소를 잡는다는 것은 eigenvector 을 하나 고른다는 뜻이고, 이걸 linear operator 에 넣어도 또다시 eigenvector 가 span 하는 공간의 원소가 된다. 따라서 eigenspace 역시 T-invariant subspace 이다.
마찬가지 예시로 아래 R^3 에서 R^3 로 가는 연산 중 특수한 T를 잡는 경우, xy-plane과 x-axis 는 T-invariant subspace 가 된다.

2. T-cyclic Subpsace (Def, Ex)
다음에 이어질 정의로 T-cyclic subspace 를 보자. 이후에는 T-invariant subspace 조건과, T-cyclic subspace 조건이 주어질 경우가 번갈아 나오기에 헷갈리기 좋다. 때문에 정의를 분명히 기억해두는 것이 좋다.

- T-cyclic subspace 란, V 위의 선형 연산자 T가 있을 때, V의 원소 x를 잡을 수 있어서, {x 자체, x를 T에 한 번 선형 연산한 것, x를 T에 두 번 선형 연산한 것, ... } 이 span 하는 공간을 말한다.
- 이걸 T-cyclic subspace of V generated by x 라 한다.

위의 T: R^3 -> R^3 로의 선형 연산은 span{e1, e2} 를 T-cyclic subspace 로 가진다. e1 에서 출발하여, Te1 = e2 가 되고, T^2(e1) = (-1, 0, 0) 으로 e1 의 상수배가 된다. 따라서 여기서 끝! 하면 된다.
Remark 몇가지를 보자. 첫째로, 만약 V 가 finite-dimensional vector space 라면, T-cyclic subspace of V 인 W의 원소들이 계속 linearly 수는 없다. 만약 그렇다면, dimW 는 무한대로 갈 것이고, 따라서 dimV 또한 무한대로 갈 것이기 때문이다.

- 즉, 어느 순간 (예시에서는 T를 n번 적용한) 에서는 linearly independent 가 깨진다는 것이며, n-1까지의 원소들의 linear combination 으로 T^n(x) 를 표현할 수 있다는 것이다.
- 이 Remark 자체는 T-cyclic subspace of V 조건이 주어졌을 때 먼저 떠올려야 할 정도로 중요하다.
둘 째로, T-cyclic subspace of V인 W은 가장 작은 T-invariant subspace containing x 가 된다.

- 이것이 바로 T-invariant subspace 와 T-cyclic subspace 의 관계가 된다.
- 1) T-cyclic subspace 는 T-invariant subspace containing x 가 된다는 것. (왜냐? T-cyclic subspace W의 임의의 원소들을 보면.. 원소를 뽑아서 T 선형 변환을 하더라도 다시 W의 원소가 되기 때문이다. 따라서 T-invariant subspace 이다.)
- 2) 만약 다른 T-invariant subspace W' containing x 를 찾았다고 한다면, T-cylic subspace 가 또다시 여기에 포함된다.
이 관계에 대한 구체적인 증명은 이어질 글에서 다시 하기로 하자.
3. Theorem: T-invariant subspace W divides characteristic polynomial of T
만약 V 위의 T 선형 연산자가 있고, T-invariant subspace of V를 W라 할 때, W의 특성다항식 (같은 T를 W에 대해 restriction 했을 때의 특성다항식) 는 T의 특성다항식을 나눈다.

증명을 보자.

- 증명은 역시 부분집합 W의 basis 를 잡고, 이걸 Extend for V 하는 과정부터 시작한다. (이 논리는 다른 증명에서도 여러번 사용되었다.)
- 그때 T를 베타에 대해 matrix representation 한 것에는, T|w 로 restriction 했을 때 베타'에 대해 matrix representation 한 것이 포함된다.
- 따라서 T의 특성다항식은 T|w 의 특성 다항식과 다른 polynomial 곱의 형태로 표현될 수 있다.
다시 정리하면, T의 특성다항식은 T|w 의 특성다항식의 배수가 된다. 같은 말로, T의 특성다항식은 T-invariant subspace W의 특성 다항식으로 분해할 수 있다. 지금은 약한 decomposition 처럼 보이지만.. 이걸로 후에는 완전히 Decompose 하는 것을 보이게 된다.
Theorem: Characteristic polynomial of T|w 를 계수들로 쓰기
W가 V 위에 주어진 선형 연산자 T에 대해 T-invariant subspace 라고 할 때, W의 특성다항식은 특정 T^k(v) 을 linear combination 으로 표현할 때 그 계수들을 t에 대한 다항식의 계수로 하여 작성할 수 있다. 이게 T-invariant subspace 의 강력함이다! 예컨대 V위에 주어진 또다른 subspace W'가 T-invariant subspace 가 아니라고 한다면, 아래와 같이 계수를 가지고 따와서 쓰는 것은 불가능하다.

- V의 dimension 이 k이므로, T-cyclic subspace 의 원소 v를 잡아서 Tv, T^2(v), .., T^k-1(v) 까지를 V의 basis 라 할 수 있다.
- 만약 위와 같이 T를 k-1번 적용한 것까지를 V를 basis 라고 하는 것과 같은 말은, 임의의 원소 v에 대해 T를 k번 적용한 것부터는 이들의 linear combination (a0, a1, ..., ak-1) 로 표현할 수 있다는 것이다.
- 만약 이렇게 적을 수 있는 경우에, T|w 즉 T를 W에 대해 restriction 한 것의 특성다항식을 T^k(v) 를 표현할 때 사용한 계수들로 바로 표현할 수 있다. 예컨대 첫 번째 원소 a0v 였던 것은 v를 떼어내고 a0 가 되고, a1Tv 의 계수 a1은 t의 계수가 된다. 이건 vandermonde matrix 에서 연습했던 것으로, 아래 증명을 보자.
(1) 에 대한 증명

- W가 T-cyclic subspace 인 것과, dimV = n 인 것이 주어져 있다고 하자.
- 이때 x, Tx, ..., T^n-1(x)의 linear combination 으로 T^n(x) 를 표현할 수 있다면, 이것 {x, Tx, ..., T^n-1(x)} 을 묶어 basis 로 잡을 수 있다. 원소 개수가 n개이고, 각각이 linearly independent 하기 때문.
(2)에 대한 증명

- 이때 이 베타에 대해 T를 matrix representation 한 것은 다음과 같다. T(v) 를 넣으면 T(v) = 0v + 1T(v) + 0T^2(v) + ... 형태이므로 이에 대한 열 벡터는 (0 1 0 0 ...) 와 같다.
- 마찬가지로 이를 T^k-2(v) 에 대한 표현까지 T^k-1(v)의 계수에 1을 표시함으로써 가능하고,
- T^k-1에 v를 넣게 되면 T^k(v)가 튀어 나오는데 아까 여기서처럼 -a0v + (-a1Tv) + ...(-ak-1T^k-1(v)) ... 형태로 구성되어 있다.
- 이 행렬의 행렬식은 vandermonde matrix 을 떠올리면 되고, 정리하면 a0부터 ak-1까지 모두 t에 대한 다항식의 계수로 들어간다. (-1)은 반복해서 k번 (모든 행에 대해) 꺼내게 되므로 앞에 (-1)^k가 붙는다.
(T^k(v)를 표현할 때 사용된 계수로 T|w의 특성다항식을 적는 예시)

실제로 basis 를 찾는 과정은 비슷하지만, 이후에 matrix representation 을 하고 각 대각행렬에서 t를 빼준 것을 가지고 행렬식을 계산하는 기존의 방식이나, T^k(v)을 linear combination 표현할 때 사용된 계수를 그대로 가지고 오는 새로운 방식이나 특성다항식이 같음을 확인한다.