[선형대수] Lecture 7: Solving Ax = 0: pivot variables, special solutions

이재호·2025년 3월 2일

목록 보기

7/31

https://ocw.mit.edu/courses/18-06-linear-algebra-spring-2010/video_galleries/video-lectures/

이전 강의에서 nullspace에 대해서 배웠다.
그렇다면 $Ax=0$ 에서 벡터 x를 어떻게 컴퓨터적인 algorithm으로 구할 수 있을까?

예시와 함께 살펴보자.

A = \begin{bmatrix} 1 & 2 & 2 & 2 \\ 2 & 4 & 6 & 8 \\ 3 & 6 & 8 & 10 \end{bmatrix}

위 행렬 $A$ 를 보고 다음과 같은 점을 알 수 있다.

$row_1 + row_2 = row_3$
$2col_1 = col_2$
따라서 $row_3$ 와 $col_1$ 은 "not independent"

그럼 계속해서 Elimination을 적용해보자.

\begin{bmatrix} 1 & 2 & 2 & 2 \\ 2 & 4 & 6 & 8 \\ 3 & 6 & 8 & 10 \end{bmatrix} \rightarrow \begin{bmatrix} 1 & 2 & 2 & 2 \\ 0 & 0 & 2 & 4 \\ 0 & 0 & 2 & 4 \end{bmatrix} \rightarrow \begin{bmatrix} 1 & 2 & 2 & 2 \\ 0 & 0 & 2 & 4 \\ 0 & 0 & 0 & 0 \end{bmatrix} = U

위 행렬은 upper matrix( $U$ )라고 보기 힘들 수 있겠지만, $U$ 이다. 그리고 이러한 형태를 "echelon Form"이라고 부른다.

위 행렬 $U$ 에서 pivot은 $U_{11}(=1)$ 과 $U_{23}(=2)$ 이다.
그리고 pivot의 개수를 rank라 부른다. " $\text{\# of pivots of $A$ = rank of $A$ = $2$}$ "
위 행렬 $U$ 에서 pivot column(variable)은 $col_1$ 과 $col_3$ 이다.
그리고 free column(variable)은 $col_2$ 와 $col_4$ 다.

그렇다면 위에서 구한 $U$ 행렬로 $Ux=0$ 에서의 $x$ 벡터를 구해보자.

x = \begin{bmatrix} \\ 1 \\ \\ 0 \end{bmatrix}

우선 free column에 임의의 값을 대입해보자. (편의상 $1, 0$ 대입)
그런 다음 $Ux=0$ 을 수식으로 정리해보자.

x_1+2x_2+2x_3+2x_4=0 \tag{$row_1$}

0x_1+0x_2+2x_3+4x_4=0 \tag{$row_2$}

에서 $x_2=1, x_4=0$ 을 대입해보자.

x_1+2+2x_3=0 \tag{$row_1$}

2x_3=0 \tag{$row_2$}

따라서 $Ux=0$ 에 대한 벡터 $x$ 를 정리하면 다음과 같이 나올 것이다.

x = \begin{bmatrix} -2 \\ 1 \\ 0 \\ 0 \end{bmatrix}

이를 아까 원래 행렬 $A$ 와 비교해서 보자.

A = \begin{bmatrix} 1 & 2 & 2 & 2 \\ 2 & 4 & 6 & 8 \\ 3 & 6 & 8 & 10 \end{bmatrix}, x = \begin{bmatrix} -2 \\ 1 \\ 0 \\ 0 \end{bmatrix}

다음과 같은 특징을 알 수 있다.

행렬 $A$ 의 $-2col_1+col_2+0col_3+0col_4=0$
그리고 $x$ 에 스칼라 곱을 해줘도 이 규칙은 변하지 않는다. 따라서 x를 다음과 같이 수정할 수 있다. $x = c \begin{bmatrix} -2 \\ 1 \\ 0 \\ 0 \end{bmatrix}$

그러면 혹시 모르니 또 다른 $x$ 를 구해보자.
이번에는 $x$ 를 다음과 정의하고 시작해보자.

x = \begin{bmatrix} \\ 0 \\ \\ 1 \end{bmatrix}

그러면 위와 같은 과정들을 거쳐서 $x$ 는 다음과 같이 나온다.

x = \begin{bmatrix} 2 \\ 0 \\ -2 \\ 1 \end{bmatrix}

마찬가지로 행렬 $A$ 와 비교해보자.

A = \begin{bmatrix} 1 & 2 & 2 & 2 \\ 2 & 4 & 6 & 8 \\ 3 & 6 & 8 & 10 \end{bmatrix}, x = \begin{bmatrix} 2 \\ 0 \\ -2 \\ 1 \end{bmatrix}

위와 마찬가지로 다음과 같은 특징을 얻는다.

행렬 $A$ 의 $2col_1+0col_2+-2col_3+col_4=0$
그리고 $x$ 에 스칼라 곱을 해줘도 이 규칙은 변하지 않는다. 따라서 x를 다음과 같이 수정할 수 있다. $x = d \begin{bmatrix} 2 \\ 0 \\ -2 \\ 1 \end{bmatrix}$

그리고 이전 강의에서 배운 $cv=0, dw=0$ 인 벡터 $v,w$ 에 대해서 $cv+dw=0$ 이라는 법칙을 통해 $x$ 를 다음과 같이 정리할 수 있겠다.

x = c \begin{bmatrix} -2 \\ 1 \\ 0 \\ 0 \end{bmatrix} + d \begin{bmatrix} 2 \\ 0 \\ -2 \\ 1 \end{bmatrix}

그러면 $Ux=0$ 에서 더 나아가, $Rx=0$ 으로 연산해보자.
여기서 $R$ 은 "reduced row echelon form"을 의미한다.
계속해서 이전 예시를 살펴보자.

U = \begin{bmatrix} 1 & 2 & 2 & 2 \\ 0 & 0 & 2 & 4 \\ 0 & 0 & 0 & 0 \end{bmatrix}

아까 위에서 행렬 $U$ 를 구했다. 그리고 이 행렬에서 pivot인 $U_{23}$ 을 통해 위에 있는 행의 2를 없애보자.

\begin{bmatrix} 1 & 2 & 2 & 2 \\ 0 & 0 & 2 & 4 \\ 0 & 0 & 0 & 0 \end{bmatrix} \rightarrow \begin{bmatrix} 1 & 2 & 0 & -2 \\ 0 & 0 & 2 & 4 \\ 0 & 0 & 0 & 0 \end{bmatrix}

그리고 pivot의 값이 1이 되도록 해보자.

\begin{bmatrix} 1 & 2 & 0 & -2 \\ 0 & 0 & 2 & 4 \\ 0 & 0 & 0 & 0 \end{bmatrix} \rightarrow \begin{bmatrix} 1 & 2 & 0 & -2 \\ 0 & 0 & 1 & 2 \\ 0 & 0 & 0 & 0 \end{bmatrix}

그러면 이제 최종 목적인 $R$ 행렬을 구할 수 있다. 여기서 $rref(A)$ 는 "행렬 $A$ 의 reduced row echelon form"이라는 의미이다.
우선 위 행렬에서 칼럼들을 나눠보자.
pivot columns : $col_1$ , $col_3$
free columns: $col_2$ , $col_4$
pivot cloumns와 free columns를 각각 따로 묶어보자.
$pivot \ columns = \begin{bmatrix} 1 & 0 \\ 0 & 1 \end{bmatrix} =I$
$free \ columns = \begin{bmatrix} 2 & -2 \\ 0 & 2 \end{bmatrix} =F$

$F$ 와 아까 본 $Ux=0$ 의 $x$ 벡터를 비교해보자.

F = \begin{bmatrix} 2 & -2 \\ 0 & 2 \end{bmatrix} , x = c \begin{bmatrix} -2 \\ 1 \\ 0 \\ 0 \end{bmatrix} + d \begin{bmatrix} 2 \\ 0 \\ -2 \\ 1 \end{bmatrix}

뭔가 유사한 점이 보이는 것 같다.
아까 pivot columns에 속했던 $col_1$ 과 $col_3$ 에 대한 행렬들의 값만 놓고 비교했을 때, 유사한 점이 보인다. 즉, pivot columns는 $F$ 의 columns와 유사하다는 것을 알 수 있다.
그리고 free columns는 $I$ 와 똑같이 나온다.
$\begin{bmatrix}-2 \\ - \\ 0 \\ -\end{bmatrix},\begin{bmatrix}2 \\ - \\ -2 \\ -\end{bmatrix} \approx -\begin{bmatrix} 2 & -2 \\ 0 & 2 \end{bmatrix}=-F$
$\begin{bmatrix}- \\ 1 \\ - \\ 0\end{bmatrix},\begin{bmatrix}- \\ 0 \\ - \\ 1\end{bmatrix} \approx \begin{bmatrix} 1 & 0 \\ 0 & 1 \end{bmatrix}=I$

그리고 $R$ 은 다음과 같이 정의할 수 있다.

R= \begin{bmatrix} I & F \\0 & 0 \end{bmatrix}

$row_1$ : $r$ 개의 pivot rows에 대한 정보
$col_1$ : $r$ 개의 pivot cols에 대한 정보
$col_2$ : $n-r$ 개의 free cols에 대한 정보

그리고 이제 $Rx=0$ 에서 $N$ (nullspace 행렬)을 구해보자.

RN= \underbrace{ \begin{bmatrix} I & F \\0 & 0\end{bmatrix} }_R N = 0

N= \begin{bmatrix} -F \\ I \end{bmatrix}

여기서 $N$ 의 칼럼들을 통해 문제를 풀이할 수 있다. 아까 $F$ 의 칼럼들은 pivot을, $I$ 의 칼럼들은 free라는 것을 확인했다.

따라서,

Rx= \begin{bmatrix} I & F \end{bmatrix} \begin{bmatrix} x_{pivot} \\ x_{free} \end{bmatrix} = 0

x_{pivot} + Fx_{free} = 0

이라는 수식을 구할 수 있다.

그런데 왜 $N= \begin{bmatrix} -F \\ I \end{bmatrix}$ 에서 $\begin{bmatrix} x_{pivot} \\ x_{free} \end{bmatrix}$ 이 나올 수 있는 건지 직관적으로 이해가 잘 안 갔다. $F$ 에 해당하는 게 free이고 $I$ 에 해당하는 게 pivot인데 순서가 반대로 나오는 게 이해가 안 됐다.
그리고 내 나름대로 이해를 해 봤다. 직관적으로 해석했을 때, pivot 변수들은 free변수들의 값에 의해서 결정된다. 따라서 $pivot = k\times free$ 와 같은 형식으로 나올 것이다. 따라서 $Rx=0$ 에서 $R=\begin{bmatrix} I & F \end{bmatrix}$ 이니깐, $x=\begin{bmatrix} x_{pivot} \\ x_{free} \end{bmatrix}$ 가 나오는 것이고, $x_{pivot}=-Fx_{free}$ 가 나온다. 이를 $N$ 으로 다루기 위해, $x=\begin{bmatrix} x_{pivot} \\ x_{free} \end{bmatrix}=\begin{bmatrix} -Fx_{free} \\ x_{free} \end{bmatrix}=\underbrace{\begin{bmatrix} -F \\ I \end{bmatrix}}_{N}x_{free}$ 로 나오는 것이라고 생각한다.

이제 예시와 함께 정리해보자.

A = \begin{bmatrix} 1 & 2 & 3 \\ 2 & 4 & 6 \\ 2 & 6 & 8 \\ 2 & 8 & 10 \end{bmatrix}

위 행렬에서 $col_1$ 과 $col_2$ 는 independent하다.
반면에 $col_3$ 는 $col_1+col_2$ 와 같으므로 not independent하다.
따라서 $col_1$ 과 $col_2$ 는 pivot columns, $col_3$ 는 free column이다.

계속해서 연산을 수행해보자.

A = \begin{bmatrix} 1 & 2 & 3 \\ 2 & 4 & 6 \\ 2 & 6 & 8 \\ 2 & 8 & 10 \end{bmatrix} \rightarrow \begin{bmatrix} 1 & 2 & 3 \\ 0 & 0 & 0 \\ 0 & 2 & 2 \\ 0 & 4 & 4 \end{bmatrix} \rightarrow \begin{bmatrix} 1 & 2 & 3 \\ 0 & 2 & 2 \\ 0 & 0 & 0 \\ 0 & 4 & 4 \end{bmatrix} \rightarrow \begin{bmatrix} 1 & 0 & 1 \\ 0 & 1 & 1 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \end{bmatrix} = R

$I=\begin{bmatrix}1 & 0 \\ 0 & 1\end{bmatrix}$
$F=\begin{bmatrix}1 \\ 1\end{bmatrix}$

따라서 $Rx=0$ 에서,

x= c\begin{bmatrix} -F \\ I \end{bmatrix} = c\begin{bmatrix} -1 \\ -1 \\ 1 \end{bmatrix}

N = \begin{bmatrix} -F \\ I \end{bmatrix} = \begin{bmatrix} -1 \\ -1 \\ 1 \end{bmatrix}

을 알 수 있다.

예시로 free variable $x_3$ 를 1로 대입해보자.

x_1 + x_3 = 0

x_2 + x_3 = 0

에서,

x_1 + 1 = 0

x_2 + 1 = 0

이 되어, $x=\begin{bmatrix} -1 \\ -1 \\ 1 \end{bmatrix}$ 이라는 결과가 나온다.

이재호

천천히, 그리고 꾸준히.

이전 포스트

[선형대수] Lecture 6: Column space and nullspace

다음 포스트

[선형대수] Lecture 7: Solving Ax = 0: pivot variables, special solutions

선형대수

[선형대수] Lecture 6: Column space and nullspace

[선형대수] Lecture 8: Solving Ax = b: row reduced form R

0개의 댓글