쌍선형형식과 행렬
쌍선형형식의 정의
두 벡터 v,w∈V를 입력받아서, 스칼라를 출력하는 함수 φ(v,w)가 다음 조건을 만족하면 쌍선형형식(bilinear form)이라 부릅니다.
- φ(αv1+v2,w)=αφ(v1,w)+φ(v2,w)
- φ(v,αw1+w2)=αφ(v,w1)+φ(v,w2)
쌍선형형식의 행렬표현
기저 {e1,…,en}에 대해서, 쌍 선형형식 φ:V×V→K는 다음과 같이 표현됩니다.
φ(x,y)=∑i,j=1nφijxiyi, 여기서
xi는 x의 좌표, yi는 x의 좌표를 뜻하며 다음을 만족합니다. (xi, yi는 i 거듭제곱 아니라 i번째 스칼라라는 의미입니다. 윗첨자를 굳이 쓰는 이유는 기저에 따라 표현을 변환하는 공식을 외우기 쉽게 하기 위해서 입니다)
x=∑i=1nxiei 그리고 y=∑i=1nyiei 그리고 φij=φ(ei,ej).
우리는 ϕij를 ϕ의 행렬표현이라 부릅니다.
Change of basis on V
만약 V의 다른 기저 {b1,…,bn}가 존재해서, 다음을 만족한다고 합시다.
bi=∑i,j=1nPijej 여기서, Pij는 기저변환(또는 좌표변환) 행렬 P의 i,j성분입니다.
-
x=∑i=1nxiei를 가정하면, x=∑i=1nxibi은 당연히 성립안합니다. 왜냐하면, scalar xi가 기저 선택에 의존하며 변하기 때문입니다. 따라서 편의상, xi대신 [x]ϵi 또는 [x]βi라 적겠습니다. 여기서, ϵ 그리고 β는 순서기저를 뜻하고 [x]ϵi 또는 [x]βi는 벡터의 좌표표현(즉 열벡터)의 i번째 성분을 의미합니다. 따라서,
x=∑i=1n[x]ϵiei=∑i=1n[x]βibi
-
[x]ϵ을 [x]β로 변환하는 수식이 어떻게 될까요? 결론부터 말하면 기저변환행렬 Pij의 역행렬로 주어집니다. 그 이유는 기저 ϵ을 기저 β로 바꾸는 규칙 Pij가 사실, β의 각 원소를 ϵ을 기준으로 어떻게 기술되는지 보여주고 있기 때문입니다. (즉, 행렬 P가 좌표변환 β→ϵ에 해당하는 것이고, 그러므로 좌표변환 ϵ→β를 얻고 싶으면 P의 역행렬을 구해야 겠지요.)
- 관찰 [x]ϵ=P[x]β (좌우변의 x 대신 ∑i,j=1nPijej와 bi을 각각 대입해서 유도)
- 결론 [x]β=P−1[x]ϵ 또는 [x]βi=(P−1)ji[x]ϵj
- 우리는 φ의 좌표 φij도 기저에 의해서 바뀌는 것을 알고 있습니다. 다음이 성립합니다. (기저변환 식들과, 구체적으로 bi=∑i,k=1nPikek 그리고 bj=∑j,l=1nPjlel 대입 후, 쌍선형성을 이용해서 유도합니다.)
φ(bi,bj)=∑k,l=1nPikPjlφ(ek,el)
행렬 P−1을 계산하지 않아도 됩니다. 즉, 2.의 좌표변환[x]ϵ→[x]β을 수행할때랑 다르죠. (그냥 관찰만 합시다.) 핵심은, V에서 V로 가는 기저변환의 언어로 좌표벡터(또는 열벡터표현) 또는 쌍선형형식의 행렬표현이 바뀌는 규칙을 기술 할 수 있다는 것입니다.
- φ(bi,bj) 그리고 φ(ei,ej)를 각각 행렬 Φβ, Φϵ라 표기합시다. 위의 수식을 행렬로 변환하면, 다음이 유도됩니다.
Φβ=PΦϵP⊤ 여기서, Pij는 행렬 P의 i,j성분입니다.
이 사실에 대한 더 자연스러운 해석을 위해서는 듀얼공간에 대한 논의가 필요합니다. 이 포스트 마지막 부분에 Dual map의 의미를 적어두었습니다.
중요한 관찰들
쌍선형형식과 벡터 공간
쌍선형형식 ϕ:V×V→K에 대한 집합{ϕ:V×V→K:ϕ is a bilinear form}은 자연스럽게 스칼라 filed의 연산을 상속하여 벡터 공간으로 볼 수 있습니다. 이는 스칼라에 의한 덧셈과 곱셈을 이용해서, 쌍선형형식의 덧셈과 스칼라배를 정의할 수 있기 때문입니다.
이 연산들을 정의하기 위해서 두 개의 쌍선형형식 φ1 및 φ2를 생각해 보겠습니다. 그리고 이 연산들은 임의의 벡터들 v 및 w와 임의의 스칼라 c에 대하여 정의됩니다.
-
쌍선형형식의 덧셈:
두 쌍선형형식 φ1 및 φ2의 합은 새로운 쌍선형형식으로, 다음과 같이 정의됩니다:
(φ1+φ2)(v,w)=φ1(v,w)+φ2(v,w)
-
스칼라와 쌍선형형식의 곱:
스칼라 c와 쌍선형형식 φ의 곱은 다음과 같이 정의됩니다:
(c⋅φ)(v,w)=c⋅φ(v,w)
이 두 연산은 벡터 공간에 대한 기본 연산들과 동일하게 동작하므로, 쌍선형형식의 집합은 벡터 공간으로 간주될 수 있습니다. 이 벡터 공간은 주어진 벡터 공간 V의 차원이 n일 때, n×n 차원이 됩니다.그리고 이 벡터공간의 0 벡터는 쌍선형형식 중에서 항상 스칼라 0을 반환하는 함수입니다.
쌍선형형식과 선형변환
쌍선형형식과 선형변환 간의 관계를 더 자세하게 이해하려면 벡터 공간과 그 듀얼 공간의 관계부터 시작해야 합니다.
듀얼 공간 (Dual Space):
벡터 공간 V의 듀얼 공간 V∗는 V의 각 벡터를 스칼라에 대응시키는 모든 선형 함수들의 집합입니다. 수학적으로, V∗={f:V→K∣f는 선형 함수}로 정의됩니다. 여기서 K는 기본 스칼라 필드입니다.
예를 들면, 유한한 차원의 벡터 공간 V의 기저가 {v1,…,vn}이라면, 듀얼 공간 V∗의 기저는 {f1,…,fn}으로 표현되며, 각 fi는 vi에 1을, 다른 모든 벡터vj,j=i를 0을 대응시키는 선형함수입니다.
기저의 성질과 fi의 선형성에 의하여 우리는 일반적인 벡터 w∈V에 대해서 fi(w)를 정확하게 알 수 있습니다. 그리고 fi가 V∗의 기저를 이룬다는 것이 매우 중요합니다. 꼭 직접 증명하고 넘어가길 추천합니다.
예시 1: 행 벡터와 듀얼 공간
벡터 공간 V=Kn을 생각해보겠습니다. 이것은 길이가 n인 열 벡터들의 집합입니다. V의 듀얼 공간 V∗는 V의 벡터를 스칼라에 매핑하는 모든 선형 함수의 집합입니다.
행 벡터 ϕ를 V∗의 원소로 생각할 때, V의 임의의 벡터 v에 대해, ϕ와 v의 행렬곱셈을 통해 스칼라를 얻을 수 있습니다. 이렇게 행 벡터는 벡터를 스칼라에 매핑하는 선형 함수로서의 역할을 합니다. 수학적으로, ϕ가 Kn의 행 벡터이고 v가 Kn의 열 벡터일 때, 행렬곱 ϕv는 스칼라 값입니다. 이는 우리가 행 벡터를 V∗의 원소로 간주하는 이유입니다.
예시 2: 연속 함수와 듀얼 공간
V을 구간 [a,b]에서 연속인 실수 또는 복소수 값을 가지는 함수들의 공간이라고 합시다. 이제 V의 어떤 함수 x(t)에 대해 다음과 같이 정의된 선형 함수를 생각해봅니다:
fϕ(x)=∫abϕ(t)x(t)dt
여기서 ϕ(t)는 V 안의 고정된 함수입니다. 위의 선형 함수 fϕ(x)는 V의 벡터를 스칼라에 대응시키므로 V∗의 원소입니다. 그러나 ϕ(t)에 대해 이와 같은 선형 함수를 정의하는 방법으로는, V∗의 모든 원소를 얻을 수는 없습니다. 예를 들어, 구간 [a,b] 내의 어떤 고정된 점 s를 생각하면, 각 함수 x(t)를 그 지점에서의 값 x(s)에 대응시키는 매핑은 선형 함수가 되지만, 어떤 함수 ϕ(t)에 대해서도 위의 형태로 표현될 수 없습니다.
위의 예시를 잘 보면, 일반적으로 V는 V∗의 차원이 다르다는 (두 기저사이의 1대1대응이 없다) 결론을 얻습니다. 이런 현상은 V가 무한차원일 때만 일어나고, 유한차원일때는 V와 V∗는 항상 차원이 같습니다.
쌍선형형식과 선형 변환:
쌍선형형식 φ:V×V→K는 두 벡터를 스칼라에 대응시키는 함수입니다. 이를 벡터를 듀얼벡터에 대응하는 듀얼 공간의 선형 함수로 간주할 수 있습니다.
이렇게 볼 때, 쌍선형형식의 벡터 공간과 T:V→V∗ 형태의 선형 변환들의 벡터 공간은 동일한 구조와 차원을 가지므로 isomorphic합니다.
특히, n차원 벡터 공간 V에 대해, 쌍선형형식의 벡터 공간의 차원은 n×n이 됩니다.
증명 스케치, V의 임의의 벡터 x에 대해, φ(x,⋅):V→K는 V∗의 원소 즉 y∈V를 φ(x,y)∈K에 대응 시키는 선형 함수입니다. 즉, 쌍선형형식은 V를 V∗로 매핑하는 (x∈V↦φ(x,⋅)∈V∗) 선형 변환으로 볼 수 있습니다. 이제, 이러한 이러한 선형변환을 Tφ:V→V∗라 표기합시다.
T를 V에서 V∗로의 선형 변환이라 합시다, 이 변환은 V의 각 벡터 x에 V∗의 선형 함수 T(x):V→K를 대응시킵니다. 이 함수T(x):V→K는 벡터 y에 대해 T(x)(y)∈K 값을 가지며, 우리는 이를 φT(x,y)로 표기합시다.
이제, φ와 Tφ 사이의 대응 관계가 일대일 대응임을 확인합시다.
φT가 쌍선형형식인 것 그리고 φT에 대응하는 선형변환TφT가 T인 것을 확인하여 φ↦Tφ가 일대일(injective)인 것을 쉽게 보일 수 있습니다. 그러나 쌍선형형식의 벡터 공간에서 T:V→V∗ 형태의 선형 변환들의 벡터 공간으로의 대응 φ↦Tφ가 onto (surjective)인 것은 비자명합니다. 저는 이것이 두 공간의 차원이 서로 같기 때문에, 일어나는 현상임만을 강조하고 넘어가겠습니다. (그래서, 증명을 위해서는 V가 유한차원이라는 조건이 꼭 필요하죠.)
마지막으로, 구성된 매핑 φ↦Tφ가 벡터 공간의 동형사상(isomorphism)임은 완전히 명백합니다. 즉, 이는 φ1+φ2↦T1+T2와 λφ↦λTφ 조건을 만족시킵니다, 여기서 Ti=Tφi이고, λ는 임의의 스칼라입니다.
대칭 쌍선형형식과 이차형식
이차형식은 한 벡터를 입력으로 받아 스칼라를 반환하는 함수입니다. (얘는 선형함수가 아닙니다) 이차형식은 일변량 완전제곱식 f(x)=ax2의 벡터 (또는 다변수) 버전으로 볼 수 있습니다.
이차형식의 정의 쌍선형형식 φ에 대해서, ϕ(x)=φ(x,x)로 정의된 함수 ϕ:V→K를 V위에서의 이차형식이라 합니다.
그리고, 이차형식은 대칭 쌍선형 형식으로 표현됩니다.
Charicteristic이 2가 아닌 체 K 위의 벡터공간 V에서의 모든 이차형식 ψ(x)는 대칭 쌍선형 형식을 사용하여 다음과 같이 표현될 수 있습니다:
ψ(x)=ϕ(x,x)
여기서 ϕ는 대칭 쌍선형 형식입니다. 더불어, 주어진 이차형식 ψ에 대해 이러한 대칭쌍선형 형식 ϕ는 유일하게 결정됩니다. (증명은 독자에게 맡깁니다.)
설명 이전 포스트에서 언급한 다음 결과와 그 증명이 완전히 같습니다. 행렬로 표현된 이차형식 Q에 대해서, 대칭행렬 A가 유일하게 존재해서 다음이 성립합니다.
Q(x)=x⊤Ax,x∈Kn (단, K의 Charicteristic은 2가 아님)
이 설명은 이차형식이 항상 어떤 대칭 쌍선형 형식의 특별한 경우로 볼 수 있음을 보여줍니다. 이는 이차형식과 쌍선형 형식 사이의 깊은 관계를 나타냅니다.
Dual Map
선형사상의 Dual은 행렬의 전치랑 대응하는 개념입니다. 왜 그런지, 살펴보겠습니다.
V와 V∗∗일치시키기
유한차원 벡터공간이라는 조건하에, 우리는 V와 V∗∗를 완전히 일치시킬 수 있습니다. 그런 점에서, 우리는 다음과 같은 표기를 사용하고자 합니다.
f,g,h와 같이 적은 것은 V∗의 원소들을 뜻합니다. 그리고 v,w,x,y,z와 같이 적은 것은 V의 원소를 뜻합니다.
V∗∗의 원소는 V의 원소 v를 이용해서 다음과 같이 표기하도록 하겠습니다.
1. v∈V에 대해서, (v,−)∈V∗∗는 다음과 같이 정의된다.
(v,f)=f(v)
2. 다음이 자명하게 성립합니다.
(x1+x2,f)=(x1,f)+(x2,f)
(x,f1+f2)=(x,f1)+(x,f2)
(αx,f)=α(x,f)
(x,αf)=α(x,f)
∀x∈V,(x,f)=0⟹f=0
∀f∈V∗,(x,f)=0⟹x=0
우리는 쌍선형 형식을 V에서 W=V∗로 가는 선형함수와 (기저선택에 의존하지 않은 방식으로) 완전히 같은 것으로 여길 수 있습니다. 그리고, (기저선택에 의존하지 않은 방식으로) V∗∗는 V와 같은 것으로 여길 수 있습니다.
V와 V∗
유한차원 벡터공간이라는 조건하에, 우리는 V와 V∗의 차원이 같음을 알고 있습니다.
그렇다면 V와 V∗를 어떻게 서로 연결시킬 수 있을까요? 이 연결의 핵심은 기저와 그에 따른 쌍대 기저(dual basis)의 개념입니다.
기저와 쌍대 기저
먼저, V의 기저를 {v1,v2,…,vn}라 하자. 그렇다면 이 기저에 대응하는 V∗의 쌍대 기저는 {f1,f2,…,fn}로 나타내질 수 있으며, 각각의 함수 fi는 다음의 특성을 갖습니다:
fi(vj)=δji
여기서 δ는 크로네커 델타(Kronecker delta)로, i와 j가 같을 때 1, 그렇지 않을 때 0을 나타냅니다.
이렇게 정의된 쌍대 기저는 V의 각 벡터에 대해 명확하게 하나의 성분을 선택하는 함수의 역할을 합니다.
그러나 주의해야 할 점은, 이 연결은 선택된 기저에 의존적이라는 것입니다. 다른 기저를 선택하면 V와 V∗의 연결도 달라집니다.
예를들어서, V의 기저변환행렬 P에 대해서, 다음이 성립하면 (여기서, P의 i,j성분은 Pij이라 표기합니다.)
vi=∑j=1nPijej 어떤 행렬 Q가 존재해서,
fi=∑j=1nQjiϵj
다음을 만족시킬겁니다. 이때, Qji를 i,j성분으로 하는 행렬은 P−1입니다.
유도과정은 아인슈타인표기법을 사용해서, 다음과 같이 보일 수 있습니다.
δji=fi(vj)=fi(Pjkek)=Qliϵl(Pjkek)=QliPjl
우변은 Qli을 i,l 성분으로 구성한 행렬과 Pjl를 l,j성분으로 구성한 행렬의 행렬곱과 같고 좌변은 단위행렬의 i,j성분과 같으므로 증명이 끝납니다.
Remark vi=∑j=1nPijej를 행렬곱 표현으로 적으면, 다음과 같습니다.
⎣⎢⎢⎡v1⋮vn⎦⎥⎥⎤=⎣⎢⎢⎢⎢⎡P11P21⋮Pn1P12P22⋮Pn2⋯⋯⋱⋯P1nP2n⋮Pnn⎦⎥⎥⎥⎥⎤⎣⎢⎢⎡e1⋮en⎦⎥⎥⎤
그리고 fi=∑j=1nQjiϵj를 행렬곱 표현으로 적으면, 다음과 같습니다.
[f1f2…fn]=[ϵ1ϵ2…ϵn]⎣⎢⎢⎢⎢⎡Q11Q21⋮Qn1Q12Q22⋮Qn2⋯⋯⋱⋯Q1nQ2n⋮Qnn⎦⎥⎥⎥⎥⎤
따라서, Qji를 i,j성분으로 하는 행렬은 P−1이므로, (위의 식에 전치를 하여 다음을 유도 할 수 있음)
⎣⎢⎢⎡f1⋮fn⎦⎥⎥⎤=(P−1)⊤⎣⎢⎢⎡ϵ1⋮ϵn⎦⎥⎥⎤ 입니다.
Definition of Dual map
T∗:W∗→V∗는 다음과 같이 정의됩니다:
T∗(g)=g∘T
Dual map의 성질
T∗에 대한 몇 가지 중요한 성질:
-
선형성:
T∗(αg1+g2)=αT∗(g1)+T∗(g2)
-
T:V→W와 S:W→U가 선형 변환일 때,
(ST)∗=T∗S∗
즉, 복합 함수의 dual은 각 함수의 dual의 반대 순서로 연결된 것과 같습니다.
-
항등 변환의 dual은 항등 변환이 됩니다.
Dual map의 행렬표현
공간 V에서 W으로의 변환 T의 행렬 표현A가 V과 W의 임의의 기저에 대해 주어졌다고 합시다. 그리고 듀얼 변환 T∗:V∗→W∗의 행렬 표현 B가 V∗와 W∗의 쌍대 기저에 대해 작성되었다고 합시다. 그러면 이 두 행렬A와 B는 서로 전치된 관계를 가집니다.
A=B⊤
결론
선형변환 T:V→V∗의 행렬표현에 대한 논의입니다. 아래 문단에서 우리는 V의 기저와 V∗의 기저가 언제나 쌍대를 이루도록 선택합니다. (Like Tensor!)
우리는 쌍선형형식 φ:V×V→K에 대해서, 두 선형함수 T:V→V∗와 T∗:V∗→V이 매우 밀접함을 알고 있습니다. (사실 상 우리는 그들 모두를 같은 것으로 보고 있습니다만,) 전자에 대한 행렬표현이 언제나, 후자에 대한 행렬 표현의 전치가 되므로, 달라집니다. 그래서, 둘중 하나를 골라서 설명하고자 합니다. 만약, 쌍선형형식을 선형함수 T:V→V∗로 바라보면, V의 기저 β={bi}와 γ={ci}와 그들의 관계 ci=Qbi가 있을 때, [T]β와 [T]γ의 관계를 관찰하면, 다음과 같을 것입니다. (단, 쌍대공간에 대해서는 대응하는 쌍대기저를 사용해 기저변환하고 쌍대인 것은 ∗를 사용해 표기)
[T]β=(V∗좌표변환행렬 γ∗→β∗)[T]γ(V좌표변환행렬 β→γ) 우리는 기저와 쌍대기저를 관찰하여 그것이 각각 (Q−1)⊤과 (Q−1)가 되어야 함을 잘 알고 있습니다. 다시말해서,
Φβ=PΦϵP⊤
에서, P는 쌍대기저ϵ∗,β∗기준으로 본 좌표변환행렬(ϵ∗→β∗)이란 의미를 가집니다.
REMARK
여기서, 좌표변환행렬(ϵ∗→β∗) P는 다음을 만족시킵니다.
기저 β∗를 f1,…,fn 그리고 기저 ϵ∗를 ϵ1,…,ϵn이라 합시다. 그리고 V∗의 원소에 대해서,
β∗로 구한 좌표를 fi라 하고, ϵ∗로 구한 좌표를 ϵi라 하면, 다음이 성립합니다.
- [f1f2…fn]=[ϵ1ϵ2…ϵn]P⊤
- ⎣⎢⎢⎡f1⋮fn⎦⎥⎥⎤=P⎣⎢⎢⎡ϵ1⋮ϵn⎦⎥⎥⎤