이차형식의 표준화 (1)

김록기·2023년 8월 23일
0

기초선형대수

목록 보기
13/13

이차형식의 표준형식

이차형식의 표준화란, 특별한 기저를 찾아서 이차형식의 행렬 표현이 대각행렬이 되도록 하는 것을 의미합니다.

다음 정리를 증명하고자 합니다.

모든 이차형식 ψ(x)\psi(\bold x)에 대해서, 다음과 같이 표현을 가능하게 하게 하는 기저가 존재합니다.
ψ(x)=λ1x12+λ2x22++λnxn2\psi(\bold x)=\lambda_1 x_1^2 + \lambda_2 x_2^2 + \cdots + \lambda_n x_n^2, 여기서 xix_ix\bold x의 좌표입니다.

다시 말해서, 선택한 기저가 β\beta라면 [x]β=[x1x2xn][\bold x]_\beta = \begin{bmatrix}x_1 \\ x_2 \\ \vdots \\ x_n\end{bmatrix}입니다. 그리고 xix_i에 대해서, 위의 식이 성립합니다.
자세히 말해서, ψ(x)\psi(\bold x)를 나타내는 대칭쌍선형 형식을 φ\varphi라 합시다. 이것은 ψ(x)=φ(x,x)\psi(\bold x)= \varphi(\bold x, \bold x)가 성립하게 하는 유일한 쌍선형형식 φ\varphi입니다. 그러면, 선택한 기저를 b1,b2,,bn\bold b_1,\bold b_2,\ldots, \bold b_n이라 할때, 다음이 성립합니다.

  • φ(bi,bj)=0\varphi(\bold b_i, \bold b_j)=0 만약, iji \ne j이면
  • φ(bi,bi)=λi\varphi(\bold b_i, \bold b_i)=\lambda_i

직교대각화와 다른점 찾고 가기.

이것은, 직교대각화랑 다른 개념입니다. 그리고, 위의 수식의 λ\lambda들은 고유값이 아닙니다.

  1. λi\lambda_i는 유일하지 않습니다. (오히려 그 반대로, 무수히 많습니다.) 왜냐하면, b1,b2,,bn\bold b_1,\bold b_2,\ldots,\bold b_n 대신에, γ={ci=Pbi}\gamma =\{\bold c_i = P \bold b_i\}을 선택하면 , 쌍선형형식의 기저변환 공식Φγ=PΦβP\Phi_\gamma = P\Phi_\beta P^\top에 의해서 (만약, 어떤 이유로 iijj가 다를 때마다, φ(ci,cj)=0\varphi(\bold c_i, \bold c_j)=0임을 알고 있다면, 단순히 φ(ci,ci)\varphi(\bold c_i, \bold c_i)를 계산해도 되죠 ) 계수 λi\lambda_i가 바뀝니다. 만약, P=kIP=kI (단, k0k \ne 0)이면, xi2x_i^2의 계수가 k2λik^2\lambda_i로 바뀝니다.

  2. 이차형식의 행렬 표현들끼리는 서로 닮지 않았습니다. (선형변환의 행렬표현은 서로 닮았습니다.)


증명을 위해 필요한 내용들을 먼저 소개 합니다.

부분공간과 행렬 표현

우리가 잘 아는, Rank Nullity 정리를 행렬 표현으로 다시 해석해 봅시다.

몇몇 정의들

\oplus기호를 소개합니다.

벡터공간 VV에 대해서,VV의 부분 집합 WVW \subset V가 벡터공간이면 WWVV의 부분공간이라 부릅니다. 예를들어서 VV의 0벡터만 모은 집합 (0)(\bold 0) 그리고 VVVV의 부분공간의 당연한 예시입니다. 그리고 vV\bold v \in V에 대해서, 다음과 같이 정의된 집합 {kv:kK}\{k\bold v:k\in K\} 역시 자명한 부분공간이며, span{v}\text{span}\{\bold v\} 또는 간단히 (v)(\bold v)라 표기합니다.

두 부분공간 V1,V2VV_1,V_2 \subset V에 대해서 다음을 벡터공간의 합이라 부릅니다.
V1+V2:={x1+x2V:x1V1,x2V2}V_1 + V_2 :=\{\bold x_1+\bold x_2 \in V : \bold x_1 \in V_1, \bold x_2 \in V_2\}
집합 V1+V2V_1 + V_2이 부분공간이기 때문에, 위의 정의는 자연스럽게 확장하여
다음을 정의할 수 있습니다. V1+V2++VkV_1 + V_2+\ldots + V_k

부분공간 V1,V2,,VkVV_1,V_2,\ldots,V_k \subset V에 대해서, 직접합 \oplus는 다음과 같이 정의됩니다.
각각의 xV1++Vk\bold x \in V_1+\ldots + V_k에 대해서, 유일한 (x1,,xk)Kk(x_1,\ldots,x_k)\in K^k가 존재해서
x=x1x1+x2x2++xkxk\bold x = x_1 \bold x_1 + x_2 \bold x_2 + \ldots + x_k \bold x_k, 여기서 xiVi\bold x_i \in V_i가 성립하면, V=V1V2VkV=V_1\oplus V_2 \oplus \ldots \oplus V_k라 적고, VVV1,,VkV_1,\ldots,V_k의 직접합(direct sum)이라 부릅니다.

몇몇 정리들

\oplus 기호에 익숙해질 수 있도록, 몇몇 당연한 내용들을 소개합니다.

V=V1V2Vk,    [x1+x2+xk=0    i{1,2,,k} xi=0]V=V_1\oplus V_2 \oplus \ldots \oplus V_k, \iff \left[ \bold x_1 + \bold x_2 + \ldots \bold x_k= 0 \implies \forall i \in\{1,2,\ldots,k\} \ \bold x_i = \bold 0 \right]
단, i{1,2,,k}, xiVi\forall i \in\{1,2,\ldots,k\}, \ \bold x_i \in V_i

아래 그림은 직합표현이 안 되는 예시입니다. 예를들어서 빨간 공간을 X\textcolor{red}{X} 그리고 노란 공간을 Y\textcolor{orange}{Y}라 합시다. 그러면, 두 평면에 교선위 한 점에 대응하는 (원점이 아닌) 벡터 vv에 대해서, vvX\textcolor{red}{X}Y\textcolor{orange}{Y}모두에 속합니다. 다시 말해서, v+(v)=0\textcolor{red}{v}+ \textcolor{orange}{(-v)}=0은, [x+x2=0    i{1,2},xi=0]\left[ \bold x + \bold x_2= 0 \implies \forall i \in\{1,2\}, \bold x_i = \bold 0 \right]의 반례가 됩니다.

x1,x2,,xk\bold x_1,\bold x_2, \ldots ,\bold x_k 는 선형독립입니다.     span{x1,x2,,xk}=(x1)(x2)(xk)\iff \text{span}\{\bold x_1,\bold x_2, \ldots ,\bold x_k\}=(\bold x_1) \oplus (\bold x_2) \oplus \ldots \oplus (\bold x_k)
단, i{1,2,,k}, xiV\forall i \in\{1,2,\ldots,k\}, \ \bold x_i \in V

x1,x2,,xn\bold x_1,\bold x_2, \ldots ,\bold x_nVV의 기저입니다.     V=(x1)(x2)(xn)\iff V = (\bold x_1) \oplus (\bold x_2) \oplus \ldots \oplus (\bold x_n)
단, i{1,2,,k}, xiV\forall i \in\{1,2,\ldots,k\}, \ \bold x_i \in V

만약 벡터공간 V1,V2V_1,V_2가 유한차원 벡터공간 VV의 부분공간이고 W=V1V2W=V_1 \oplus V_2이면, WW의 차원은 V1V_1V2V_2의 차원의 합과 같습니다.

만약 V=V1++VrV=V_1+\cdots + V_r이고, VV의 차원이 ViV_i의 차원들의 합과 같으면(i=1,2,,ri=1,2,\ldots,r), 다음이 성립합니다.V=V1V2VrV=V_1\oplus V_2 \oplus \ldots \oplus V_r

Rank Nullity Theorem

VV의 차원을 nn 그리고 T:VWT:V\to W의 rank를 (다시 말해서, TT의 image의 차원을) rr이라 하면 다음이 성립합니다.

1.RANK NULLITY 정리 Ker T\text{Ker} \ T의 차원은 nrn-r이다.
2.그리고, TT의 행렬 표현 [T]βγ[T]_\beta^\gamma가 다음과 같은 블록대각행렬이 되도록, VVWW의 기저 β\beta, γ\gamma를 선택할 수 있다.
[Ir000]=[1000010000000000]\begin{bmatrix}I_r & 0 \\ 0 & 0\end{bmatrix} =\begin{bmatrix} 1 &\cdots &0 & 0 & \cdots &0\\ \vdots& \ddots& \vdots & \vdots & \ddots & \vdots \\ 0&\cdots & 1 & 0 & \cdots & 0 \\ 0&\cdots & 0 & 0& \cdots & 0 \\ \vdots & \ddots & \vdots & \vdots&\ddots &\vdots\\ 0& \cdots & 0 & 0 & \cdots & 0\end{bmatrix}
여기서, IrI_rr×rr\times r 단위행렬이다.

증명

먼저, Rank Nullity 정리를 증명합니다.

독자는 선형사상 TT를 이용하여, KerT\text{Ker} T가 벡터공간임을 증명할 수 있습니다. 그리고 독자는 공역을 제한해서 얻은 TImT:VImTT|^{\text{Im}T} : V \to \text{Im}T (여기서, TImTT|^{\text{Im}T}TImT(v)=T(v)T|^{\text{Im}T}(v) = T(v)으로 정의된다.)가 surjective(Onto)한 선형사상임을 증명한 뒤 이를 이용해서, TT의 image ImT\text{Im}T가 벡터공간임을 증명할 수 있습니다.

주의: 단순히 공역을 제한한다고 그 제한된 집합이 벡터공간이 되는 것이 아니다.
사실 Rank Nullity정리는 대수학에서 다루는 Isomorphisim 정리의 특수한 경우로, (독자가 대수학을 아는 경우) 그 정리에서 Image가 Domain을 Kernel로 Quotient한 것이 동형이던 것을 기억합시다.

그리고 (기저의 존재성을 이용하여 ) 독자는 다음을 보일 수 있습니다.

  1. 다음을 만족하는 VV의 부분공간 VrV_r이 존재한다.
    V=VrKer TV=V_r \oplus \text{Ker} \ T

  2. 다음을 만족하는 WW의 부분공간 WnrW_{n-r}이 존재한다.
    W=imTWnrW=\text{im} T \oplus W_{n-r}

직합\oplus의 성질에 의하여 좌변 차원은 우변 차원 합과 일치해야합니다.
따라서, VrV_r의 차원은 ndim(KerT)n-\text{dim}(\text{Ker} T )
그리고 WnrW_{n-r}의 차원은 nrn-r임을 바로 알 수 있습니다. (물론, 정리의 첫번째 결론에 의해서, VrV_r의 차원은 rr입니다. 그러나, 아직 이것은 논리적으로 도출되지 않았습니다.)

이제, 우리는 TT의 정의역을 VrV_r로 제한해서 선형변환 TVr:VrVT|_{V_r}:V_r \to V을 생각할 것입니다.

VrV_r이 벡터공간이므로, TVr:VrVT|_{V_r}:V_r \to V (여기서, TVr:VrVT|_{V_r}:V_r \to VTVr(v)=T(v)T|_{V_r}(v) = T(v)로 정의된다)은 선형변환입니다.

그러면 TVrT|_{V_r}의 kernel은 (0)(\bold 0)입니다. 왜냐하면, 정의에 의해서 Ker TVrVrKer \ T|_{V_r} \subseteq V_r 그리고 Ker TVrKer TKer \ T|_{V_r} \subseteq Ker \ T이고, V=VrKer TV=V_r \oplus \text{Ker} \ T라는 조건에 의해서, TKerT=(0)T \cap \text{Ker} T = (\bold 0 )이기 때문에, Ker TVr(0)Ker \ T|_{V_r} \subseteq (\bold 0 )이기 때문입니다. 그리고 TVrT|_{V_r}의 image는 TT와 같습니다. (그 이유의 설명은 독자에게 맡깁니다.) 따라서, 다음 정리에 의해서, VrV_rim T\text{im} \ T의 차원은 rr로 같습니다.

정리 선형변환 T:VWT:V\to W일대일이면, VVTVT|_V의 차원이 같습니다.
증명 VV의 기저 b1,,br\bold b_1,\ldots, \bold b_r에 대해서, T(b1),T(b2),,T(br)T(\bold b_1), T(\bold b_2), \ldots, T(\bold b_r)이 선형독립이고, 이것으로 구성한 집합이 자명하게 im T\text{im} \ T의 spanning set이므로 TVT|_V기저입니다. 한편, TT가 일대일이므로, TVT|_V의 기저는 VV의 기저와 크기가 같습니다.

TT의 행렬표현에 대한 주장을 증명합니다.

독자는, (벡터공간 차원의 유일성을 이용하여, 더 근본적으로는 Steinitz exchange lemma를 이용하여) 다음을 보일 수 있습니다.

  1. V=VrKer TV= V_r \oplus \text{Ker} \ T의 기저, v1,v2,,vn\bold v_1, \bold v_2,\ldots,\bold v_n이 다음을 만족하도록 선택할 수 있다. v1,,vr\bold v_1,\ldots,\bold v_rVrV_r의 기저이고 vr+1,vn\bold v_{r+1} \ldots, \bold v_nKer T\text{Ker} \ T의 기저이다. 다시말해서, T(vr+1)==T(vn)=0T(\bold v_{r+1}) = \cdots = T(\bold v_n) =0이다.
  2. wi=T(vi)\bold w_i = T(\bold v_i), i=1,,ri=1,\ldots, r이라 하면, w1,w2,,wr\bold w_1, \bold w_2, \ldots, \bold w_rim T\text{im} \ T의 기저이다.
  3. WW의 차원을 mm이라 하자. ( WimTW \supset \text{im} T이므로 mrm\ge r이다.) 그러면, wr+1,wr+2,,wm\bold w_{r+1},\bold w_{r+2}, \ldots, \bold w_m이 존재해서 다음을 만족한다.
    • w1,w2,,wr\bold w_1, \bold w_2, \ldots, \bold w_rim T\text{im} \ T의 기저이다. (왜냐하면, wi=T(vi)\bold w_i= T(\bold v_i), for iri\le r)
    • wr+1,wr+2,,wm\bold w_{r+1},\bold w_{r+2}, \ldots, \bold w_m
    • w1,,wm\bold w_1,\ldots,\bold w_mWW의 기저이다.

위에 적은 성질이 만족하도록 잘 골라서 구성한, VV의 기저 β\betav1,,vn\bold v_1,\ldots, \bold v_n이라 하고 WW의 기저 γ\gammaw1,,wm\bold w_1,\ldots, \bold w_m 그러면

T(v1)=1w1+0w2++0wr+0wr+1++0vmT(\bold v_1) = 1\bold w_1 + 0 \bold w_2 + \ldots + 0 \bold w_r + 0 \bold w_{r+1} + \ldots + 0 \bold v_m
T(v2)=0w1+1w2++0wr+0wr+1++0vmT(\bold v_2) = 0\bold w_1 + 1 \bold w_2 + \ldots + 0 \bold w_r + 0 \bold w_{r+1} + \ldots + 0 \bold v_m
\vdots
T(vr)=0w1+0w2++1wr+0wr+1++0vmT(\bold v_r) = 0\bold w_1 + 0 \bold w_2 + \ldots + 1 \bold w_r + 0 \bold w_{r+1} + \ldots + 0 \bold v_m
그리고, T(vr+1)==T(vn)=0T(\bold v_{r+1}) = \cdots = T(\bold v_n) =\bold 0이 성립합니다. 다시 말해서, 행렬표현에 대한 정리의 결론이 성립합니다.

profile
문제풀이를 즐김

0개의 댓글