1. 선형변환
선형 변환의 정의를 먼저 살펴보자.
V와 T는 모두 F 벡터 공간이라 하자. 모든 x,y∈F에 대하여 다음을 모두 만족하는 함수 T:V→W를 V에서 W로 가는 선형 변환이라고 한다.
1. T(x+y)=T(x)+T(y)
2. T(cx)=cT(x)
우리가 흔히 선형이라고 표현하는 것은 함수 T가 선형 변환일때를 의미하는 것이다.
이때 선형변환 T:V→W는 다음의 성질들을 가지게 된다.
- T가 선형이면 T(0)=0이다.
- T가 선형이기 위한 필요충분조건은 모든 x,y∈V,c∈F에 대하여 T(cx+y)=cT(x)+T(y)인 것이다.
- T가 선형이면, 모든 x,y∈V에 대하여 T(x−y)=T(x)−T(y)이다.
- T가 선형이기 위한 필요충분조건은 모든 x1,x2,…,xn∈V와 a1,…,an∈F에 대하여 다음 식을 만족하는 것이다.
T(i=1∑naixi)=i=1∑naiT(xi)
위의 조건들은 모두 선형변환에 대한 정의를 이용하면 간단하게 증명할 수 있다. 어떤 함수가 선형인지 살펴 볼 때는 주로 2번 성질을 사용하게 된다.
2. 다양한 공간들
벡터 공간에는 다양한 부분공간들이 있는데 하나씩 살펴보도록 하자.
2-1. 영공간(Null Space)과 상공간(Range)
영공간의 정의는 다음과 같다.
벡터공간 V,W와 선형변환 V:V→W에 대하여 T(x)=0인 x∈V를 원소로 가지는 집합이고, N(T)로 나타낸다. 집합으로 나타내면 N(T)={x∈V:T(x)=0}이다.
상공간의 정의는 다음과 같다.
벡터공간 V,W와 선형변환 V:V→W에 대하여 T의 함숫값을 원소로 가지는 W의 부분집합이고, R(T)라 표기한다. 집합으로 나타내면 R(T)={T(x):x∈V}이다.
우리가 함수를 배울때, 치역이라 부르는 공간이 벡터공간에서 상공간이 된다.
선형변환의 영공간과 상공간이 벡터공간의 부분공간임을 밝히는 과정은 다음과 같다. V,W 각각의 영벡터는 0V,0W로 표기하자.
x,y∈N(T)일 때,
T(x+y)T(cx)=T(x)+T(y)=0W+0w=0w=cT(x)=c0w=0w
x,y∈R(T),c∈F,T(v)=x,T(w)=y,x,y∈V일 때,
T(v+w)T(cv)=T(v)+T(w)=x+y=cT(v)=cx
정리 1. 즉, 벡터공간 V,W와 선형변환 T:V→W에 대하여 N(T),R(T)는 각각 V,W의 부분공간이다.
그런데 여기서 재밌는 점은 선형변환의 상공간을 생성하는 집합은 선형변환의 기저를 통해 만들 수 있다는 점이다.
벡터공간 V,W와 선형변환 T:V→W에서 V의 기저를 β={v1,v2,…,vn}이라 할 때,
모든 i에 대해 T(vi)∈R(T)이다.
그러므로 span(T(β))⊆R(T)이다.
w∈R(T)라 할 때, w=T(v)인 v∈V는 당연히 존재한다. 이때, β가 V의 기저이므로, 다음과 같은 표현이 가능하다.
v=i=1∑naivi
그런데 T는 선형이므로, w=∑i=1naiT(vi)∈span(T(β))이다. 즉, 역으로 다음도 성립하게 되는 것이다.
R(T)⊆span(T(β))=span({T(v1),T(v2),…,T(vn)})
결국 R(T)⊆span(T(β)⊆R(T)꼴이므로 다음이 성립한다.
정리 2. 벡터공간 V,W와 선형변환 T:V→W에서 V의 기저를 β={v1,v2,…,vn}이라 할 때,
R(T)=span(T(β))=span({T(v1),T(v2),…,T(vn)})
즉, range의 생성집합은 선형변환 전의 공간의 기저를 선형변환하여 생성할 수 있다.
2-2. 영공간과 상공간의 차원
영공간과 상공간의 차원은 다음과 같이 표기한다.
벡터공간 V, W의 선형변환 T:V→W에 대하여 N(T)와 R(T)가 유한차원이라 가정하자.
- N(T)의 차원을 nullity라고 하고, nullity(T)라고 표기한다.
- R(T)의 차원을 랭크라하고, rank(T)로 표기한다.
여기서 잠깐 생각을 해보자. 영공간과 상공간은 어떻게 보면 서로 반대의 개념이다. 만약 v∈V에서 T(v)=0w인 v가 많다면, 상공간의 크기는 자연스레 작아질 것이다. 상공간의 많은 벡터가 영 벡터가 되어 버리기 때문이다. 이를 정리하면 다음과 같다.
정리 3. 차원 정리(Dimension Theorem)
벡터공간 V,W와 선형변환 T:V∈W에 대하여 V가 유한차원이면, 다음이 성립한다.
nullity(T)+rank(T)=dim(V)
증명은 다음과 같다.
dim(V)=n,dim(N(T))=k라 하자. 이때 당연히 k≤n이다. N(T)의 기저를 {v1,v2,…,vk}라고 하자. 이때 N(T)의 기저를 확장하여 V의 기저 β={v1,v2,…,vn}을 얻을 수 있다.
S={T(vk+1,vk+2,…,T(vn)}이 R(T)의 기저임을 보이자. 이때, 1≤i≤k에 대해 T(vi)=0임을 기억하면 다음과 같이 정리할 수 있다.
R(T)=span({T(v1),T(v2),…,T(vn)}=span({T(vk+1),T(vk+2),…,T(vn)})=span(S)
이제 S로 R(T)를 생성할 수 있음을 알았다. S가 R(T)의 기저이기 위해서는 선형독립이어야 한다. 즉, ∑i=k+1nbiT(vi)=0이면 된다. T가 선형변환임을 이용해 다음과 같은 동치식을 만들 수 있다.
T(i=k+1∑nbivi)=0⟺i=k+1∑nbivi∈N(T)
이때 S가 N(T)에 속하지 않는 v로 구성한 집합이므로 적절한 c1,…,ck∈F가 존재하여 다음 식이 만족된다.
i=k+1∑nbivi=i=1∑kcivi⟺i=1∑i(−ci)vi+i=k+1∑nbivi=0
이때 β는 V의 기저라 했기 때문에 모든 i에 대해 bi=0일 수 밖에 없고 즉, S는 선형독립이 된다. 이와 더불어 T(vk+1),…,T(vn)이 서로 다른 벡터임을 이야기했으므로, rank(T) = n - k가 된다.
이때 한가지 공간에 대해 정의하고 넘어가자. 나중에 최적화와도 관련된 개념이다.
정의 F-벡터공간 V,W에 대하여 V에서 W로 가는 모든 선형변환의 모임으로 이루어진 벡터공간을 L(V,W)라 표기한다. 또한, V=W면, 간단히 L(V)로 표기한다.
또한, V에서 W로 가는 모든 선형변환을 원소로 하는 집합 L(V,W)가 벡터 공간의 공리를 만족한다.