4. 선형변환, 공간

김재희·2021년 8월 16일
0

Linear Algebra

목록 보기
4/18

1. 선형변환

선형 변환의 정의를 먼저 살펴보자.

VVTT는 모두 FF 벡터 공간이라 하자. 모든 x,yFx, y \in F에 대하여 다음을 모두 만족하는 함수 T:VWT : V \to WVV에서 WW로 가는 선형 변환이라고 한다.
1. T(x+y)=T(x)+T(y)T(x + y) = T(x) + T(y)
2. T(cx)=cT(x)T(cx) = cT(x)

우리가 흔히 선형이라고 표현하는 것은 함수 TT가 선형 변환일때를 의미하는 것이다.
이때 선형변환 T:VWT : V \to W는 다음의 성질들을 가지게 된다.

  1. TT가 선형이면 T(0)=0T(0) = 0이다.
  2. TT가 선형이기 위한 필요충분조건은 모든 x,yV,cFx, y \in V, c \in F에 대하여 T(cx+y)=cT(x)+T(y)T(cx + y) = cT(x) + T(y)인 것이다.
  3. TT가 선형이면, 모든 x,yVx, y \in V에 대하여 T(xy)=T(x)T(y)T(x - y) = T(x) - T(y)이다.
  4. TT가 선형이기 위한 필요충분조건은 모든 x1,x2,,xnVx_1, x_2, \dots, x_n \in Va1,,anFa_1, \dots, a_n \in F에 대하여 다음 식을 만족하는 것이다.
    T(i=1naixi)=i=1naiT(xi)\displaystyle T(\sum^n_{i = 1}a_i x_i) = \sum^n_{i = 1} a_iT(x_i)

위의 조건들은 모두 선형변환에 대한 정의를 이용하면 간단하게 증명할 수 있다. 어떤 함수가 선형인지 살펴 볼 때는 주로 2번 성질을 사용하게 된다.

2. 다양한 공간들

벡터 공간에는 다양한 부분공간들이 있는데 하나씩 살펴보도록 하자.

2-1. 영공간(Null Space)과 상공간(Range)

영공간의 정의는 다음과 같다.

벡터공간 V,WV, W와 선형변환 V:VWV: V \to W에 대하여 T(x)=0T(x) = 0xVx \in V를 원소로 가지는 집합이고, N(T)N(T)로 나타낸다. 집합으로 나타내면 N(T)={xV:T(x)=0}N(T) = \{x \in V: T(x) =0\}이다.

상공간의 정의는 다음과 같다.

벡터공간 V,WV, W와 선형변환 V:VWV: V \to W에 대하여 TT의 함숫값을 원소로 가지는 WW의 부분집합이고, R(T)R(T)라 표기한다. 집합으로 나타내면 R(T)={T(x):xV}R(T) = \{T(x) : x \in V\}이다.

우리가 함수를 배울때, 치역이라 부르는 공간이 벡터공간에서 상공간이 된다.
선형변환의 영공간과 상공간이 벡터공간의 부분공간임을 밝히는 과정은 다음과 같다. V,WV, W 각각의 영벡터는 0V,0W0_V, 0_W로 표기하자.
x,yN(T)x, y \in N(T)일 때,

T(x+y)=T(x)+T(y)=0W+0w=0wT(cx)=cT(x)=c0w=0w\begin{aligned} T(x + y) &= T(x) + T(y) = 0_W + 0_w = 0_w \\ T(cx) &= cT(x) = c0_w = 0_w \end{aligned}

x,yR(T),cF,T(v)=x,T(w)=y,x,yVx, y \in R(T), c \in F, T(v) = x, T(w) = y, x, y \in V일 때,

T(v+w)=T(v)+T(w)=x+yT(cv)=cT(v)=cx\begin{aligned} T(v + w) &= T(v) + T(w) = x + y\\ T(cv) &= cT(v) = cx \end{aligned}

정리 1. 즉, 벡터공간 V,WV, W와 선형변환 T:VWT :V \to W에 대하여 N(T),R(T)N(T), R(T)는 각각 V,WV, W의 부분공간이다.

그런데 여기서 재밌는 점은 선형변환의 상공간을 생성하는 집합은 선형변환의 기저를 통해 만들 수 있다는 점이다.

벡터공간 V,WV, W와 선형변환 T:VWT: V \to W에서 VV의 기저를 β={v1,v2,,vn}\beta = \{ v_1, v_2, \dots, v_n\}이라 할 때,

모든 i에 대해 T(vi)R(T)T(v_i) \in R(T)이다.
그러므로 span(T(β))R(T)span(T(\beta)) \subseteq R(T)이다.

wR(T)w \in R(T)라 할 때, w=T(v)w = T(v)vVv \in V는 당연히 존재한다. 이때, β\betaVV의 기저이므로, 다음과 같은 표현이 가능하다.

v=i=1naivi\displaystyle v = \sum^n_{i = 1}a_iv_i

그런데 TT는 선형이므로, w=i=1naiT(vi)span(T(β))w = \sum^n_{i = 1}a_iT(v_i) \in span(T(\beta))이다. 즉, 역으로 다음도 성립하게 되는 것이다.

R(T)span(T(β))=span({T(v1),T(v2),,T(vn)})R(T) \subseteq span(T(\beta)) = span(\{T(v_1), T(v_2), \dots, T(v_n)\})

결국 R(T)span(T(β)R(T)R(T) \subseteq span(T(\beta) \subseteq R(T)꼴이므로 다음이 성립한다.

정리 2. 벡터공간 V,WV, W와 선형변환 T:VWT: V \to W에서 VV의 기저를 β={v1,v2,,vn}\beta = \{ v_1, v_2, \dots, v_n\}이라 할 때,
R(T)=span(T(β))=span({T(v1),T(v2),,T(vn)})R(T) = span(T(\beta)) = span(\{T(v_1), T(v_2), \dots, T(v_n)\})

즉, range의 생성집합은 선형변환 전의 공간의 기저를 선형변환하여 생성할 수 있다.

2-2. 영공간과 상공간의 차원

영공간과 상공간의 차원은 다음과 같이 표기한다.

벡터공간 V, W의 선형변환 T:VWT:V\to W에 대하여 N(T)N(T)R(T)R(T)가 유한차원이라 가정하자.

  • N(T)N(T)의 차원을 nullitynullity라고 하고, nullity(T)nullity(T)라고 표기한다.
  • R(T)R(T)의 차원을 랭크라하고, rank(T)rank(T)로 표기한다.

여기서 잠깐 생각을 해보자. 영공간과 상공간은 어떻게 보면 서로 반대의 개념이다. 만약 vVv \in V에서 T(v)=0wT(v) = 0_wvv가 많다면, 상공간의 크기는 자연스레 작아질 것이다. 상공간의 많은 벡터가 영 벡터가 되어 버리기 때문이다. 이를 정리하면 다음과 같다.

정리 3. 차원 정리(Dimension Theorem)
벡터공간 V,WV, W와 선형변환 T:VWT : V \in W에 대하여 VV가 유한차원이면, 다음이 성립한다.

nullity(T)+rank(T)=dim(V)nullity(T) + rank(T) = dim(V)

증명은 다음과 같다.
dim(V)=n,dim(N(T))=kdim(V) = n, dim(N(T)) = k라 하자. 이때 당연히 knk \leq n이다. N(T)N(T)의 기저를 {v1,v2,,vk}\{v_1, v_2, \dots, v_k\}라고 하자. 이때 N(T)N(T)의 기저를 확장하여 VV의 기저 β={v1,v2,,vn}\beta = \{v_1, v_2, \dots, v_n\}을 얻을 수 있다.

S={T(vk+1,vk+2,,T(vn)}S = \{T(v_{k+1}, v_{k+2}, \dots, T(v_n)\}R(T)R(T)의 기저임을 보이자. 이때, 1ik1 \leq i \leq k에 대해 T(vi)=0T(v_i) = 0임을 기억하면 다음과 같이 정리할 수 있다.

R(T)=span({T(v1),T(v2),,T(vn)}=span({T(vk+1),T(vk+2),,T(vn)})=span(S)\begin{aligned} R(T) &= span(\{T(v_1), T(v_2), \dots, T(v_n)\}\\ &= span(\{T(v_{k+1}), T(v_{k+2}), \dots, T(v_n)\}) = span(S) \end{aligned}

이제 S로 R(T)를 생성할 수 있음을 알았다. S가 R(T)의 기저이기 위해서는 선형독립이어야 한다. 즉, i=k+1nbiT(vi)=0\sum^n_{i = k+1}b_iT(v_i) = 0이면 된다. T가 선형변환임을 이용해 다음과 같은 동치식을 만들 수 있다.

T(i=k+1nbivi)=0    i=k+1nbiviN(T)\displaystyle T(\sum^n_{i = k+1}b_iv_i) = 0 \iff \sum^n_{i = k+1}b_iv_i \in N(T)

이때 S가 N(T)에 속하지 않는 vv로 구성한 집합이므로 적절한 c1,,ckFc_1, \dots, c_k \in F가 존재하여 다음 식이 만족된다.

i=k+1nbivi=i=1kcivi    i=1i(ci)vi+i=k+1nbivi=0\sum^n_{i = k+1}b_iv_i = \sum^k_{i=1}c_iv_i \iff \sum^i_{i = 1}(-c_i)v_i + \sum^n_{i = k+1}b_iv_i = 0

이때 β\betaVV의 기저라 했기 때문에 모든 i에 대해 bi=0b_i = 0일 수 밖에 없고 즉, S는 선형독립이 된다. 이와 더불어 T(vk+1),,T(vn)T(v_{k+1}), \dots, T(v_n)이 서로 다른 벡터임을 이야기했으므로, rank(T) = n - k가 된다.

이때 한가지 공간에 대해 정의하고 넘어가자. 나중에 최적화와도 관련된 개념이다.

정의 FF-벡터공간 V,WV, W에 대하여 VV에서 WW로 가는 모든 선형변환의 모임으로 이루어진 벡터공간을 L(V,W)L(V, W)라 표기한다. 또한, V=WV = W면, 간단히 L(V)L(V)로 표기한다.

또한, VV에서 WW로 가는 모든 선형변환을 원소로 하는 집합 L(V,W)L(V, W)가 벡터 공간의 공리를 만족한다.

0개의 댓글