4.2 Linear transformation (1)

Jaehyun_onelion·2023년 3월 17일
0

선형대수학

목록 보기
18/42

이번 포스트에서는 Linear transformation에 대해서 알아보겠습니다.


1) Linear Transformation


(1) Transformation


Transformation은 다음과 같이 정의됩니다.


Definition : Transformation

Transformation is a function whose inputs and outputs are vectors

T:RnRmT : \mathbb R^n \rightarrow \mathbb R^m

A transformation

T:RnRnT : \mathbb R^n \rightarrow \mathbb R^n

is called operator on Rn\mathbb R^n

Transformation이란, input과 output이 vector인 함수입니다. 고등학교에서 배운 함수는 input과 output이 실수인, 또는 input이 벡터지만 output이 실수인 경우만 다루었다면, transformation은 이에서 확장하여 input과 output이 모두 vector인 경우를 뜻합니다. 또한, input과 output이 Rn\mathbb R^n으로 같다면, 해당 transformation은 operator가 됩니다. Transformation 또한 함수이기 때문에, 기존의 함수에서 사용했던 개념인 정의역(domain), 공역(codomain), 치역(image) 또한 똑같이 정의됩니다.


Example

TT : transformation that maps a vector x=(x1,x2)\boldsymbol{x}=(x_1, x_2) in R2\mathbb R^2 into the vector 2x=(2x1,2x2)2\boldsymbol{x} = (2x_1, 2x_2) in R2\mathbb R^2

input과 output 모두 R2\mathbb R^2에 속하는 함수입니다. 따라서 TT는 transformation입니다. 또한, input과 output이 모두 R2\mathbb R^2에 속하므로, operator입니다.


(2) Linear transformation


Definition : Linear transformation

A function T:RnRmT : \mathbb R^n \rightarrow \mathbb R^m is called a linear transformation from Rn\mathbb R^n to Rm\mathbb R^m if following two properties hold for all vectors u,v\boldsymbol{u, v} in Rn\mathbb R^n and for all scalars cc.

  1. T(cu)=cT(u)T(c\boldsymbol u) = cT(\boldsymbol{u})
  2. T(u+v)=T(u)+T(v)T(\boldsymbol{u+v}) = T(\boldsymbol{u}) + T(\boldsymbol{v})

If n=mn=m, then the linear transformation TT is called linear operator.

Linear transformation이 정의되기 위해서는 transformation이 scalar multiplication, vector addition에 대한 조건을 만족하여야 합니다. 또한 input과 output이 Rn\mathbb R^n인 linear transformation을 linear operator라고 정의합니다. 어떤 transformation이 linear transformation임을 확인하기 위해서는 정의역에 존재하는 임의의 벡터에 해대서 위 두 조건을 만족하는지 확인하면 됩니다.


example

TT : transformation that maps a vector x=(x1,x2)\boldsymbol{x}=(x_1, x_2) in R2\mathbb R^2 into the vector 2x=(2x1,2x2)2\boldsymbol{x} = (2x_1, 2x_2) in R2\mathbb R^2

위 transformation이 linear transformation을 만족하는지 확인해봅시다.

  1. u,vR2,T(u+v)=2(u+v)=2u+2v=T(u)+T(v)\boldsymbol{u, v} \in \mathbb R^2, T(\boldsymbol{u+v}) = 2(\boldsymbol{u+v}) = 2\boldsymbol{u}+2\boldsymbol{v} = T(\boldsymbol{u}) + T(\boldsymbol{v}),
  2. uR2,cR,T(cu)=2cu=c2u=cT(u)\boldsymbol u \in \mathbb R^2, c \in \mathbb R, T(c\boldsymbol{u})=2c\boldsymbol{u}=c2\boldsymbol{u}=cT(\boldsymbol{u})

R2\mathbb R^2에 속하는 임의의 vector와 scalar에 대해서 두 조건이 성립하기 때문에, 위 transformation은 linear transformation입니다. 또한 정의역과 공역이 R2\mathbb R^2이므로 linear operator입니다.

Linear transformation의 특징을 파악하기 위해서는 matrix transformation이 필요합니다.


Definition : Matrix transformation

If AA is m×nm \times n matrix, and if x\boldsymbol{x} is a column vector in Rn\mathbb R^n, then the product AxA\boldsymbol x is a vector in Rm\mathbb R^m. Therefore, the transformation

TA=RnRmTA(x)=AxT_A = \mathbb R^n \rightarrow \mathbb R^m \\ T_A(\boldsymbol{x}) = A\boldsymbol{x}

is called the multiplication by AA or the transformation AA

즉 matrix product로 이루어지는 transformation을 matrix transformation이라고 합니다.


example

A=[112534],b=[707]A = \begin{bmatrix}1 & -1 \\ 2 & 5 \\ 3 & 4 \end{bmatrix}, \boldsymbol{b} = \begin{bmatrix}7 \\ 0 \\ 7 \end{bmatrix}

이 때, TA(x)=AxT_A(\boldsymbol x) = A\boldsymbol{x}가 됩니다. T(x)=bT(\boldsymbol{x}) =\boldsymbol{b}를 만족시키는 x\boldsymbol{x}Ax=bA\boldsymbol{x} = \boldsymbol{b}를 만족합니다. 따라서 matrix equation을 풀면

x=[61]\boldsymbol{x} = \begin{bmatrix} 6 \\ -1 \end{bmatrix}

이 됩니다.


example

T0T_0 : Zero transformation

output이 0인 transformation 또한 matrix transformation입니다. Zero matrix를 이용하여 transformation을 정의할 수 있습니다.

T0:RnRmT(x)=0x=0T_0 : \mathbb R^n \rightarrow \mathbb R^m \\ T(\boldsymbol{x}) = 0\boldsymbol{x} = 0

example

TIT_I : Identity transformation

Output이 input과 같도록 만드는 transformation 또한 matrix transformation입니다. Identity matrix를 이용하여 transformation을 정의할 수 있습니다.

TI=RnRnTI(x)=Ix=xT_I = \mathbb R^n \rightarrow \mathbb R^n \\ T_I(\boldsymbol{x}) = I\boldsymbol{x} = \boldsymbol{x}

이 때, 위 transfromation은 operator이기도 합니다.

다음은 linear transformation과 matrix transformation 사이의 관계를 알아봅시다. 사실, 두 transformation은 같은 transformation입니다.


Theorem

All linear transformation are matrix transformation

Let T:RnRmT : \mathbb R^n \rightarrow \mathbb R^m be a linear transformation. If e1,e2,...,en\boldsymbol{e_1, e_2, ..., e_n} are standard unit vectors in Rn\mathbb R^n, and x\boldsymbol{x} is any vector in Rn\mathbb R^n, then T(x)T(\boldsymbol{x}) can be represented as

T(x)=Ax where A=[T(e1)T(e2)...T(en)]T(\boldsymbol{x}) = Ax \\ \ \\ where \ A =\begin{bmatrix}T(\boldsymbol{e_1}) & T(\boldsymbol{e_2})&...&T(\boldsymbol{e_n}) \end{bmatrix}

AA : Standard matrix for TT and A=[T]A=\begin{bmatrix}T\end{bmatrix}

즉 모든 linear transformation은 matrix transformation으로 나타낼 수 있습니다. 또한 matrix tranformation은 linear transformation이므로, 사실상 두 transformation은 같은 transfromation임을 알 수 있습니다.

example

T:R3R2T:[x1x2x3][x1+x2x2x3]T : \mathbb R^3 \rightarrow \mathbb R^2 \\ T : \begin{bmatrix}x_1 \\ x_2\\x_3 \end{bmatrix} \rightarrow \begin{bmatrix}x_1 + x_2 \\ x_2 - x_3\end{bmatrix}

먼저 위 transformation이 linear transformation인지 확인해봅시다.

  1. u,vR3,u=[u1u2u3],v=[v1v2v3]\boldsymbol{u, v} \in \mathbb R^3, \boldsymbol{u} = \begin{bmatrix}u_1 \\ u_2 \\ u_3 \end{bmatrix}, \boldsymbol{v} = \begin{bmatrix}v_1 \\ v_2 \\ v_3 \end{bmatrix}

    T(u+v)=[(u1+v1)+(u2+v2)(u2+v2)(u3+v3)]=[u1+u2u2u3]+[v1+v2v2v3]=T(u)+T(v)T(\boldsymbol{u+v}) = \begin{bmatrix}(u_1+v_1) + (u_2 + v_2) \\ (u_2+v_2)-(u_3+v_3)\end{bmatrix} = \begin{bmatrix}u_1 + u_2 \\ u_2-u_3\end{bmatrix} + \begin{bmatrix}v_1 + v_2 \\ v_2-v_3\end{bmatrix} = T(\boldsymbol{u}) + T(\boldsymbol{v})

  2. cRc \in \mathbb R

    T(cu)=[cu1+cu2cu2cu3]=c[u1+u2u2u3]=cT(u)T(c\boldsymbol u) = \begin{bmatrix}cu_1 +cu_2 \\ cu_2 - cu_3 \end{bmatrix} = c\begin{bmatrix}u_1 +u_2 \\ u_2 - u_3 \end{bmatrix} = cT(\boldsymbol{u})

따라서 위 transformation은 linear transformation입니다. 위 linear transformation의 standard matrix를 찾기 위해 unit vector을 이용하면

T([100])=[10],  T([010])=[11],  T([001])=[01]T(\begin{bmatrix}1 \\0 \\0 \end{bmatrix}) = \begin{bmatrix}1 \\ 0\end{bmatrix}, \ \ T(\begin{bmatrix}0 \\1 \\0 \end{bmatrix}) = \begin{bmatrix}1 \\ 1 \end{bmatrix}, \ \ T(\begin{bmatrix}0 \\0 \\1 \end{bmatrix}) = \begin{bmatrix}0 \\ -1 \end{bmatrix}

따라서

[T]=[110011][T] = \begin{bmatrix}1 & 1 & 0 \\ 0 & 1 & -1 \end{bmatrix}

임을 알 수 있습니다.

지금까지 transformation과 linear transformation을 알아보았습니다. 다음 포스트에서는 kernel과 range에 대해서 알아보도록 하겠습니다. 질문이나 오류 있으면 댓글 남겨주세요! 감사합니다!


Appendix : Proof of Theorem


Linear tranformation과 matrix transformation의 관계에 대한 정리에 대한 증명입니다.


Theorem

Let T:RnRmT : \mathbb R^n \rightarrow \mathbb R^m be a linear transformation. If e1,e2,...,en\boldsymbol{e_1, e_2, ..., e_n} are standard unit vectors in Rn\mathbb R^n, and x\boldsymbol{x} is any vector in Rn\mathbb R^n, then T(x)T(\boldsymbol{x}) can be represented as

T(x)=Axwhere A=[T(e1)T(e2)...T(en)]T(\boldsymbol{x}) = Ax \\ where \ A =\begin{bmatrix}T(\boldsymbol{e_1}) & T(\boldsymbol{e_2})&...&T(\boldsymbol{e_n}) \end{bmatrix}

AA : Standard matrix for TT and A=[T]A=\begin{bmatrix}T\end{bmatrix}

  • Proof

xRn\boldsymbol x \in \mathbb R^n이라고 하면

x=[x1x2xn]=x1[100]+x2[010]++xn[001]=x1e1+x2e2++xnen\boldsymbol{x} = \begin{bmatrix}x_1 \\ x_2 \\ \vdots \\ x_n \end{bmatrix} = x_1\begin{bmatrix}1 \\ 0 \\ \vdots \\ 0 \end{bmatrix} + x_2 \begin{bmatrix} 0 \\ 1 \\ \vdots \\ 0 \end{bmatrix} + \cdots + x_n \begin{bmatrix} 0 \\ 0 \\ \vdots \\ 1\end{bmatrix} = x_1\boldsymbol{e_1} + x_2\boldsymbol{e_2} + \cdots + x_n\boldsymbol{e_n}

, 즉 standard unit vector의 linear combination으로 표현됩니다.

TT가 linear transformation이므로, T(x)T(\boldsymbol{x})은 다음과 같이 표현됩니다.

T(x)=T(x1e1+x2e2++xnen)=x1T(e1)+x2T(e2)++xnT(en)T(\boldsymbol{x}) =T(x_1\boldsymbol{e_1} + x_2\boldsymbol{e_2} + \cdots + x_n\boldsymbol{e_n}) = x_1T(\boldsymbol{e_1}) + x_2T(\boldsymbol{e_2}) + \cdots + x_nT(\boldsymbol{e_n})

이는 matrix product에 따라

x1T(e1)+x2T(e2)++xnT(en)=[T(e1)T(e2)T(en)][x1x2xn]x_1T(\boldsymbol{e_1}) + x_2T(\boldsymbol{e_2}) + \cdots + x_nT(\boldsymbol{e_n}) = \begin{bmatrix}T(\boldsymbol{e_1}) & T(\boldsymbol{e_2}) & \cdots & T(\boldsymbol{e_n}) \end{bmatrix}\begin{bmatrix}x_1 \\ x_2 \\ \vdots \\ x_n\end{bmatrix}

이 되어, 다음 matrix

[T]=[T(e1)T(e2)T(en)][T] =\begin{bmatrix}T(\boldsymbol{e_1}) & T(\boldsymbol{e_2}) & \cdots & T(\boldsymbol{e_n}) \end{bmatrix}

의 transformation이 됩니다. 즉

T:RnRmT(x)=[T]xT : \mathbb R^n \rightarrow \mathbb R^m \\ T(\boldsymbol{x}) = [T]\boldsymbol{x}

따라서, linear transformation은 matrix transformation이고, standard unit vector를 통해 standard matrix를 구할 수 있습니다.

profile
데이터 분석가 새싹

0개의 댓글