[선형대수] Lecture 15: Projections onto subspaces

이재호·2025년 3월 9일

선형대수

목록 보기

14/31

https://ocw.mit.edu/courses/18-06-linear-algebra-spring-2010/video_galleries/video-lectures/

먼저 vector projection에 대해서 알아보자.

위 그래프처럼 벡터 $a,b \in \mathbb{R}^1$ 가 존재한다고 가정해보자. 두 벡터는 서로 다른 subspace에 존재한다.
그리고 벡터 $b$ 를 벡터 $a$ 쪽으로 project한다. 이 projection을 $p$ 라고 하자.
$p$ 는 $a$ 의 subspace에 존재하므로 다음과 같이 표현이 가능하다. $p=xa$ (x: scalar value)
$e$ 는 벡터 $b$ 와 벡터 $a$ 간의 차이(error) 벡터를 의미한다. $e=b-p$ 라고 볼 수 있다.

따라서 (지난 강의에서 배운 orthogonal 개념을 통해) 다음과 같이 수식을 정리할 수 있다.

a^Te=0

a^Te=a^T(b-p)=a^T(b-xa)=0

xaa^T=a^Tb

\therefore x=\frac{a^Tb}{a^Ta}

그리고 위에서 구한 $x$ 로 $p$ 를 다음과 같이 정리할 수 있다.

\text{(projection vector) } p=ax=a\frac{a^Tb}{a^Ta}

\text{(projection matrix) } P=\frac{aa^T}{a^Ta}

\therefore p=Pb

그리고 다음과 같은 점들을 알 수가 있다.

$C(P)=\text{line through $a$}$
$rank(P)=1$ (위 예시의 경우, subspace(vector) $a$ 가 1차원 rank를 갖기 때문에)
$P^T=P$ (symmetric)
$P^2=P$

이제 위와 같은 방식으로 projection을 한다는 것을 알았다. 그렇다면 왜 projection이 필요한 걸까?
왜냐하면 $Ax=b$ 에 대해서 항상 솔루션이 존재하지 않기 때문에, $A\hat x=p$ (p는 projection을 의미)와 같은 방식으로 문제를 해결해야 하기 때문이다.

\text{Why project?}

\text{Because $Ax=b$ may have no solution.}

\text{So, solve $A\hat x=p$ instead. ($p$ is projection of $b$ onto $C(A)$)}

이제 vector가 아닌 subspace에 대한 projection을 알아보자.
basis $a_1$ , $a_2$ 로 구성된 $C(A)$ 가 있다고 해보자.

\text{plane of $a_1,a_2$}=C(A)=\begin{bmatrix}a_1 & a_2\end{bmatrix} \text{ ($a_1,a_2$ are $col_1, col_2$ respectively)}

그리고 $C(A)$ 에 존재하지 않는 벡터 $b$ 가 있다고 해보자.

\text{$b$ is not in $C(A)$}

그러면 이 경우 벡터 $b$ 와 subspace $C(A)$ 와의 오차 $e$ 는 0이 아닐 것이다.

e=b-p\ne0 \\ \text{($e$ is perpendicular(수직) to the plane.)}

그리고 다음과 같이 수식을 정리해보자.

p=\hat x_1a_1 + \hat x_2a_2

p=A\hat x

위에서 $\hat x$ 는 어떻게 구할 수 있을까? 이 질문에 대한 핵심은 $b-A\hat x(=e)$ 가 subspace와 수직이라는 점을 이용하는 것이다.

\text{What is $\hat x$?}

\text{key : $b-A\hat x$ is perpendicular to the plane.}

그러면 이어서 수식을 정리해보자.

a_1^T(b-A\hat x)=0=a_2^T(b-A\hat x)

\begin{bmatrix} a_1^T \\ a_2^T \end{bmatrix} (b-A\hat x) = \begin{bmatrix} 0 \\ 0 \end{bmatrix}

A^T(b-A\hat x)=0

A^Te=0

\therefore \text{$e$ is in $N(A^T)$} \rightarrow e \perp C(A)

수식을 정리해보니 $e$ 는 $A^T$ 의 null space에 존재하는 것을 알 수 있고, 이에 따라 $e$ 는 $C(A)$ 와 수직이라는 것이 증명되었다.

이제 subspace에 대한 증명도 마쳤으니 이어서 수식을 정리해보자.

Ax=b

A^TA\hat x = A^Tb

\text{$\hat x$ is best solution.}

위처럼 $Ax=b$ 의 솔루션이 존재하지 않을 경우, 양 변에 $A^T$ 을 곱해줌으로써 최적의 솔루션 $\hat x$ 를 찾을 수 있다. (왜냐하면 이렇게 하면 $\hat x$ 이 최대한 $x$ 와 근사되기 때문이다.)

그러면 이어서 수식을 정리해보자.

\hat x = (A^TA)^{-1}A^Tb

p=A\hat x = A(A^TA)^{-1}A^Tb = Pb

P=A(A^TA)^{-1}A^T

\text{when $A$ is a invertible matrix, $P=I$}

P^T=A^{TT}((A^TA)^{-1})^TA^T=A(A^TA)^{-1}A^T=P

P^2=A(A^TA)^{-1}A^TA(A^TA)^{-1}A^T = A(A^TA)^{-1}IA^T=A(A^TA)^{-1}A^T=P

위 수식을 통해 마찬가지로 subspace에 대해서도 $P^T=P$ 와 $P^2=P$ 라는 것을 증명할 수 있다.

이재호

천천히, 그리고 꾸준히.

이전 포스트

[선형대수] Lecture 14: Orthogonal vectors and subspaces

다음 포스트

[선형대수] Lecture 15: Projections onto subspaces

선형대수

[선형대수] Lecture 14: Orthogonal vectors and subspaces

[선형대수] Lecture 16: Projection matrices and least squares

0개의 댓글