Chapter3. 행렬과 행렬대수2

장원준·2022년 11월 15일
0

선형대수학

목록 보기
4/9

네이버 부스트캠프 AI Tech 4기 선형대수학 스터디 3회차

선형대수학 이상구 저 Chapter3


3.4 부분공간과 일차독립

정의 [부분공간]

  • 집합 W()W (\neq \varnothing)Rn\mathbb{R}^n의 부분집합일 때, 아래 두 조건을 만족하면 WWRn\mathbb{R}^n부분공간(subspace)
    (1) x, yWx+yW\mathbf{x},\ \mathbf{y} \in W \longrightarrow \mathbf{x} + \mathbf{y} \in W (덧셈에 닫힘)
    (2) xW, kRkxW\mathbf{x} \in W,\ k \in \mathbb{R} \longrightarrow k\mathbf{x} \in W (스칼라배에 닫힘)
  • Rn\mathbb{R}^n의 부분집합이라면 벡터의 차원이 nn이하이겠구나
  • 부분집합과 부분 공간은 다른 의미지만, 조건이 만족되면 부분집합을 부분공간이라고 할 수 있구나
  • 부분공간임을 확인하려면 위 두 조건을 검증해보자!
  • Rn\mathbb{R}^n의 모든 부분공간은 영벡터 포함
    • xW, 0R0x=0W\mathbf{x} \in W,\ 0 \in \mathbb{R} \longrightarrow 0\mathbf{x} = \mathbf{0} \in W
  • (예시) (x, y)R2(x,\ y) \in \mathbb{R}^2에 대해 y=xy = x 위의 점의 집합은 위 두 조건을 만족하지만 y=x+1y = x + 1 직선의 경우에는 (1)조건을 만족하지 못하여 R2\mathbb{R}^2의 부분공간이 아님
  • 정리하면, R2\mathbb{R}^2의 모든 부분공간은 아래와 같음
    • 영공간 {0}\{\mathbf{0}\}
    • 원점을 지나는 line (y=xy = x 등)
    • R2\mathbb{R}^2 전체
  • 그럼 R3\mathbb{R}^3의 모든 부분공간은 아래와 같음
    • 영공간 {0}\{\mathbf{0}\}
    • 원점을 지나는 line (y=xy = x 등)
    • 원점을 지나는 평면
    • R3\mathbb{R}^3 전체
  • 행렬 A=[aij]m×nA = [a_{ij}]_{m \times n}에 대해 집합 W={xRnAx=0}W = \{\mathbf{x} \in \mathbb{R}^n | A\mathbf{x} = \mathbf{0}\}Rn\mathbb{R}^n의 부분공간이라면, 이러한 WWAx=0A\mathbf{x} = \mathbf{0}해공간(solution space) 또는 AA영공간(null space)이라 함

정의 [일차결합]

  • Rn\mathbb{R}^n의 부분집합 {x1, x2, , xk}\{\mathbf{x}_1,\ \mathbf{x}_2,\ \dots,\ \mathbf{x}_k\}에 대해 벡터 xRn\mathbf{x} \in \mathbb{R}^n
                                     x=c1x1+c2x2++ckxk,     c1, c2, , ckR\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \mathbf{x} = c_1\mathbf{x}_1 + c_2\mathbf{x}_2 + \cdots + c_k\mathbf{x}_k,\ \ \ \ \ c_1,\ c_2,\ \dots,\ c_k \in \mathbb{R}
    의 꼴로 표현되면, x\mathbf{x}를 벡터 x1, x2, , xk\mathbf{x}_1,\ \mathbf{x}_2,\ \dots,\ \mathbf{x}_k일차결합(linear combination)이라 함
  • 일차결합의 정의는 아래와 같이 부분공간을 이해하는 데에 필요
  • Rn\mathbb{R}^n의 부분집합 S={x1, x2, , xk}S = \{\mathbf{x}_1,\ \mathbf{x}_2,\ \dots,\ \mathbf{x}_k\}에 대해 SSkk개 벡터들의 일차결합 전체의 집합, W={c1x1+c2x2++ckxkc1, c2, , ckR}W = \{c_1\mathbf{x}_1 + c_2\mathbf{x}_2 + \cdots + c_k\mathbf{x}_k | c_1,\ c_2,\ \dots,\ c_k \in \mathbb{R}\}Rn\mathbb{R}^n의 부분공간
  • 위 상황에서 아래와 같이 용어를 정의
    • WWSS에 의해 생성된(spanned) Rn\mathbb{R}^n의 부분공간
    • 집합 SSWW생성(span)
    • SSWW생성집합(spanning set)
    • 기호로는, W=span(S)W = \text{span}(S) 또는 W= <S>W =\ <S>
  • 여기서 Rn\mathbb{R}^n에 있는 모든 벡터가 SSkk개 벡터들의 일차결합이면, 반대로 생각하여 SS라는 집합에서 Rn\mathbb{R}^n이라는 집합이자 공간을 생성한 것과 같으므로 Rn= <S>={c1x1+c2x2++ckxkc1, c2, , ckR}\mathbb{R}^n =\ <S> = \{c_1\mathbf{x}_1 + c_2\mathbf{x}_2 + \cdots + c_k\mathbf{x}_k | c_1,\ c_2,\ \dots,\ c_k \in \mathbb{R}\}
    • 적절한 2개의 벡터가 있어야 평면 위 벡터를 모두 표현할 수 있듯이, 여기서 kknn이어야 Rn\mathbb{R}^n 공간을 모두 표현할 수 있을 것!
  • 참고 [Chapter1에서 정의한 일차결합]
    • 위 정의와 동일하지만 집합의 개념이 추가되었음

정리하자면 Rn\mathbb{R}^n 공간 내의 어떤 집합 WW가 있을 때, WW를 이루는 한 벡터의 스칼라배, 두 벡터 사이의 덧셈, 여러 벡터 사이의 일차결합이 다시 해당 공간 Rn\mathbb{R}^n에 속한다면 이 집합 WWRn\mathbb{R}^n의 부분공간이라는 것. 다만 벡터의 일차결합으로 생성한 새로운 집합 WW'은 기존 WWspan\text{span}이라고 함

정의 [행공간과 열공간]

  • A=[aij]Mm×nA = [a_{ij}] \in M_{m \times n}이면 AA의 열벡터 A(1),A(2),,A(n)A^{(1)},A^{(2)},\dots,A^{(n)}생성(span)
                                         <A(1), A(2), , A(n)>\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ <A^{(1)},\ A^{(2)},\ \dots,\ A^{(n)}> 또는 Col(A)\text{Col}(A)
    Rm\mathbb{R}^m의 부분공간, 이를 AA열공간(column space)
  • A=[aij]Mm×nA = [a_{ij}] \in M_{m \times n}이면 AA의 행벡터 A(1),A(2),,A(n)A_{(1)},A_{(2)},\dots,A_{(n)}생성(span)
                                         <A(1), A(2), , A(n)>\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ <A_{(1)},\ A_{(2)},\ \dots,\ A_{(n)}> 또는 Row(A)\text{Row}(A)
    Rn\mathbb{R}^n의 부분공간, 이를 AA행공간(row space)
  • 행렬의 모든 행벡터, 열벡터를 가지고 일차결합을 쓸 수 있을 것인데, 그것은 그 차원 공간의 부분집합이자 부분공간인 것이 자명하므로 이를 행공간, 열공간으로 정의하는 것

정의 [일차독립과 일차종속]

  • S={x1, x2, , xk}RnS = \{\mathbf{x}_1,\ \mathbf{x}_2,\ \dots,\ \mathbf{x}_k\} \subseteq \mathbb{R}^n에 대해
    c1x1+c2x2++ckxk=0    (c1, c2, , ckR)c1=c2==ck=0c_1\mathbf{x}_1 + c_2\mathbf{x}_2 + \cdots + c_k\mathbf{x}_k = \mathbf{0}\ \ \ \ (c_1,\ c_2,\ \dots,\ c_k \in \mathbb{R}) \rightarrow c_1 = c_2 = \cdots = c_k = 0
    이면 벡터 x1, x2, , xk\mathbf{x}_1,\ \mathbf{x}_2,\ \dots,\ \mathbf{x}_k 또는 집합 SS일차독립(linearly independent), 반대로 일차독립이 아니라면 일차종속(linearly dependent)라고 함

벡터의 일차결합으로 어떤 공간을 생성할 수 있는지 알아보듯이 일차독립, 일차종속도 동일한 방식으로 조사할 수 있음. (연립일차방정식을 세워 cc의 값을 구하는 방식)

  • 집합 S={x1, x2, , xk}RnS = \{\mathbf{x}_1,\ \mathbf{x}_2,\ \dots,\ \mathbf{x}_k\} \subseteq \mathbb{R}^n에 대해 다음이 성립

    • 집합 SS가 일차종속일 필요충분조건은 SS에 속하는 한 벡터가 나머지 벡터들의 일차결합으로 표시되는 것(당연)
    • 집합 SS가 영벡터를 포함하면 SS는 일차종속
      • 영벡터의 계수 c0c_0을 0이 아닌 무엇으로 하든 영벡터에 의해 0이 되므로 0이 아닌 cc가 존재하여 일차종속 가능
    • 집합 SS의 부분집합 SS'이 일차종속이면 SS도 일차종속이고, SS가 일차독립이면 SS'도 일차독립
  • Rn\mathbb{R}^n에서 m(>n)m (> n)개의 벡터는 항상 일차종속

    • 일차독립이라면 집합 내의 어떠한 벡터든 다른 벡터들의 합으로 나타낼 수 없는 고유한 벡터라는 것이고, 그 한계는 Rn\mathbb{R}^n에서 최대 nn
    • 따라서 nn개를 넘는 벡터를 가진 집합은 반드시 어떤 벡터들의 합으로 다른 벡터를 표현할 수 있음

평면을 표현하려면 최소 2개의 벡터가 필요하듯이 Rn\mathbb{R}^n을 표현하기 위해서는 벡터가 최소 nn개가 필요하겠지만, 이들이 일차독립이려면 최대 nn개의 벡터여야만 하는 것. 이게 중요할까? 싶지만 아무튼 그렇다는 것.

3.5 선형연립방정식의 해집합과 행렬

정리 [행렬의 가역성과 선형연립방정식의 해 사이의 관계]

  • nn차의 정사각행렬 AA가 가역이고 bbRn\mathbb{R}^n의 벡터일 때, 연립방정식 Ax=bA\mathbf{x} = \mathbf{b}는 유일한 해 x=A1b\mathbf{x} = A^{-1}\mathbf{b}를 갖는다.
  • AA가 가역이니까 A1A^{-1}이 존재하고, 반대쪽으로 넘기면 당연히 성립하겠지?
  • 동차선형연립방정식은 자명한 해(유일해)를 가지거나, 무수히 많은 해를 갖는 경우 두 가지뿐
    • nn개의 미지수, mm개의 방정식일 때 m<nm < n이라면 자명하지 않은 해를 가짐

정의 [수반동차연립방정식]

  • 선형연립방정식 Ax=bA\mathbf{x} = \mathbf{b}에 대하여 Ax=0A\mathbf{x} = \mathbf{0}Ax=bA\mathbf{x} = \mathbf{b}수반동차연립방정식(associated homogeneous system of linear equations)이라고 한다.
  • 그래서 뭐?
    • 선형연립방정식의 해집합은 단순히 수반동차연립방정식의 해공간을 단순히 x0\mathbf{x}_0만큼 평행이동한 것!
    • 여기서 x0\mathbf{x}_0특수해(particular solution)이라 함
    • 이는 선형연립방정식의 해에 r=s==0r = s = \cdots = 0을 대입해 구할 수 있음
  • 특수해만큼 평행이동 한 것은 어떤 의미일까?
    • Ax=0A\mathbf{x} = \mathbf{0}의 해공간 WW에 특수해 x0\mathbf{x}_0을 더한 평행이동집합으로 생각
    • 그렇다면 x0+W\mathbf{x}_0 + W는 영벡터를 가지지 않아서 Rn\mathbb{R}^n의 부분공간이 아님

  • 행렬 AAnn차의 정사각행렬이면, 아래 명제들은 동치(equivalent)
    • RREF(AA) = InI_n
    • AA는 기본행렬의 곱으로 표현
    • AA는 가역
    • Ax=0A\mathbf{x} = \mathbf{0}은 유일해 0\mathbf{0}를 가짐
    • Ax=bA\mathbf{x} = \mathbf{b}는 모든 bRn에대해유일해\mathbf{b} \in \mathbb{R}^n에 대해 유일해
    • AA의 열벡터들은 일차독립
    • AA의 행벡터들은 일차독립
  • Ax=0A\mathbf{x} = \mathbf{0}의 해공간의 벡터는 AA의 행벡터에 직교
    • A(i)x=0A_{(i)} \cdot \mathbf{x} = 0이어야하므로 행렬 AA의 각각의 행벡터들에 직교(orthogonal)인 벡터들
    • 두 벡터 사이 각도가 90°\degree라면, 내적은 0이라는 점과 결이 같음
  • Hyperplane(초평면)이란?
    • R2\mathbb{R}^2에서 xyxy-평면의 직선은 ax+by=cax + by = c, 0이 아닌 (x,y)(x, y) 해집합
    • R3\mathbb{R}^3에서 xyzxyz-공간의 평면은 ax+by+cz=bax +by + cz = b, 0이 아닌 (x,y,z)(x, y, z) 해집합
    • Rn\mathbb{R}^n에서 초평면은 a1x+a2x2++anxn=ba_1x + a_2x_2 + \cdots + a_nx_n = b, ai0\exist a_i \neq 0인 해집합
      • 여기서 b=0b = 0이면 원점을 지나는 hyperplane
    • a={xRnax=0}\mathbf{a}^{\perp} = \{\mathbf{x} \in \mathbb{R}^n | \mathbf{a} \cdot \mathbf{x} = 0\}a\mathbf{a}orthogonal complement(직교보공간)
      • 아래 그림에서는 마치 3차원 공간 내의 평면처럼 보이지만, 이는 그저 평면을 일반화하여 초'평면'이라고 하기 때문에 이해를 돕기 위해 그려 놓은 것
      • 실제로는 4차원 이상의 경우 눈으로 확인할 수 있게 그려지지 않음

3.6 특수행렬들(Special matrices)

  • 대각선행렬(diagonal matrix)
    • 주대각선성분 이외의 모든 성분이 0인 정사각행렬

  • 단위행렬(identity matrix)

    • 주대각선성분이 모두 1인 행렬
    • InI_n
  • 스칼라행렬(scalar matrix)

    • kInkI_n

  • 대각선행렬의 특징
    • 일반적인 행렬 AA의 열에 DD에 대응하는 주대각선성분을 곱한 결과와 동일
    • 대각선행렬의 거듭제곱은 주대각선성분을 거듭제곱한 대각선행렬과 같음

정의 [대칭행렬과 반대칭행렬]

  • 정사각행렬 AAAT=AA^T = A를 만족하면 AA대칭행렬(symmetric matrix), AT=AA^T = -A를 만족하면 반대칭행렬(skew-symmetric matrix)
  • 대각선 기준으로 뒤집었을 때 같은 위치에 있는 것끼리 같다면 대칭행렬, 부호만 반대라면 반대칭행렬이라고 이해하면 된다.
  • AA가 임의의 정사각행렬이라면 아래를 만족
    • A+ATA + A^T는 대칭행렬
    • AATA - A^T는 반대칭행렬
    • 따라서, 임의의 정사각행렬은 대칭행렬과 반대칭행렬의 합으로 유일하게 나타낼 수 있음
    • 위 두 개를 각각 1/21/2하여 더하면 AA이기 때문
  • 삼각행렬
    • 하삼각행렬(lower triangular matrix): 주대각선 위의 모든 성분이 0인 정사각행렬
    • 상삼각행렬(upper triangular matrix): 주대각선 아래의 모든 성분이 0인 정사각행렬
    • A, BA,\ B가 하삼각행렬일 때 아래를 만족
      • ABAB는 하삼각행렬(lower triangular matrix)
      • AA가 가역행렬이면 A1A^{-1}도 하삼각행렬
      • 모든 ii에 대해 aii=1a_{ii} = 1이면 A1A^{-1}의 주대각선성분들도 모두 1
  • 정사각행렬 AA에 대해 Ak=OA^k = O가 되는 양의 정수 kk가 존재하면?
    • AAnilpotent
    • (IA)(I - A)는 가역행렬
    • (IA)1=I+A+A2++Ak1(I - A)^{-1} = I + A + A^2 + \cdots + A^{k-1}
    • 위 둘 곱하면 II
profile
장원준

0개의 댓글