[2주차 Day3] 09강: 벡터공간과 최소제곱법

pengu·2021년 5월 4일
0

KDT 배움기록

목록 보기
10/12
post-thumbnail

노션 기록

집합(set)과 공간(space):

중등 교과과정부터 시작하기


집합(set)은 임의의 원소(element)를 수집하여 만든 모듬입니다

어떤 방식으로 모아도 되니, 다음과 같은 집합도 생각할 수 있습니다

{수학,3.14,(1,2),강아지}\tt \{ 수학, 3.14, (1, 2), 강아지 \}



연산에 닫혀 있는 집합(set)

집합이 연산에 닫혀있다 는 개념이 있습니다.

어떤 연산을 생각한 다음, 집합에서 임의의 원소를 뽑아 연산을 수행한 결과가 여전히 집합의 원소로 있다면, 해당 집합은 연산에 닫혀있다고 합니다


다음 집합은 덧셈 연산에 닫혀 있습니다. 곱셈 연산에도 닫혀 있습니다.

{xxR}\{ x | x \in \mathbb{R} \}

다음 집합은 덧셈 연산에 닫혀 있지 않습니다. 하지만 곱셈 연산에는 닫혀 있습니다.

{1,0,1}\{-1, 0, 1\}



공간(Space)


공간(space)은 다음의 두 연산에 닫혀있는 집합입니다
  • 덧셈 연산에 닫혀있다
    • 집합에서 임의의 두 원소 x,yx, y를 뽑아 더해도 그 결과 x+yx + y는 집합의 원소입니다
  • 스칼라 곱 연산에 닫혀있다
    - 집합에서 임의의 한 원소 xx를 뽑아 임의의 스칼라 ss배 한 결과 sxsx는 집합의 원소입니다

다음과 같이 nn-벡터의 집합은 모두 공간입니다

Rn={xx=(x1,x2,,xn),(,xiR)}\mathbb{R}^n = \{{\bf x | x} = (x_1, x_2, \cdots, x_n), \quad (단, x_i \in \mathbb{R})\}

앞으로 모든 nn-벡터 집합 Rn\mathbb{R}^nnn차원 벡터 공간(vector space)이라 부를 수 있습니다


열공간(Column Space)


행렬 AA의 열벡터들에 대한 가능한 모든 선형조합의 결과를 모아 집합으로 구성할 수 있을 것이다

이들 집합을 열공간(column space)이라 하고 다음과 같이 표기한다

col(A){\rm col}(A)

해가 있는 선형 시스템 (Consistent Linear System)

선형시스템 Ax=bA \bf x = b가 해를 가지면(consistent), 다음을 만족한다

bcol(A){\bf b} \in {\rm col}(A)

해가 없는 선형 시스템 (Inconsistent Linear System)

선형시스템 Ax=bA \bf x = b의 해가 없으면(inconsistent), 다음을 만족한다

bcol(A){\bf b} \notin {\rm col}(A)



최소제곱법(least squares method)


열공간(column space)으로 투영


선형시스템 Ax=bA \bf x = b에 대한 해가 없음에도 불구하고, 우리가 할 수 있는 최선이 무엇인가를 생각해보자

행렬 AA가 정의하는 열공간에서 우리의 목표 b\bf b와 가장 가까운 지점은 b\bf b를 열공간에 투영(projection)한 지점일 것이다.

즉, 달성가능한 최선의 목표 projWb{\rm proj}_W \bf b를 생각할 수 있다.

b\bf b를 구하지는 못하지만 내가 구할 수 있는 답 중 b\bf b랑 가장 가까운 애까지는 찾아보겠다!!



최소제곱법(least squares method)?


최소제곱법은 선형시스템 Ax=bA \bf x = b에 대한 해 x\bf x가 없음에도 불구하고, 할 수 있는 최선의 대안 xˉ\bf \bar x를 내놓는 기법이다

최소제곱법은 원래의 선형시스템 Ax=bA \bf x = b가 아닌 다음의 선형시스템을 해결한다

Axˉ=bˉ(,bˉ=projWb)A {\bf \bar x = \bar b} \quad (단, {\bf \bar b =} {\rm proj}_W \bf b)

이 방법은 목표 b\bf b와 달성가능한 목표 bˉ\bf \bar b의 차이를 나타내는 벡터 (bbˉ)\bf (b-\bar b)의 제곱길이를 최소화시키는 의미를 가지기 때문에 최소제곱법(least squares method)이라 불리운다

주어진 선형시스템의 양변에 전치행렬 ATA^T를 곱하면 최소제곱법의 해를 구할 수 있다

Ax=bATAxˉ=ATbxˉ=(ATA)1ATb\begin{aligned} &A\bf x = b\\ \Rightarrow \quad & A^TA{\bf \bar x} = A^T{\bf b}\\ \Rightarrow \quad & {\bf \bar x} = (A^TA)^{-1}A^T{\bf b}\\ \end{aligned}

최소제곱법으로 구한 해 xˉ\bf \bar x는 원래의 선형시스템을 만족하는 해는 아니다

AxˉbˉA {\bf \bar x \ne \bar b}

최소제곱법으로 구한 해 xˉ\bf \bar x는 다음을 만족하는 근사해(approximate solution)이다.

Axˉ=projWbA {\bf \bar x} = {\rm proj}_W \bf b




최소제곱법의 응용: 선형회귀(Linear Regression)


2차원 공간에 mm개의 정점 {(xi,yi)}i=1m\{(x_i, y_i)\}^m_{i=1}이 그림과 같이 있을 때,

이를 잘 설명할 수 있는 직선 y=mx+by=mx+b를 구하는 문제를 생각해보자.


이를 선형회귀(linear regression) 문제라 한다.

선형회귀 문제는 다음과 같이 최소제곱법으로 풀 수 있다

  1. 선형시스템 구성
    • 직선이 각 정점을 모두 지나간다고 가정하고 선형시스템 Ax=bA \bf x = b 구성
      (단, 주어진 모든 정점을 지나가는 직선은 존재하지 않으므로 선형시스템의 해는 존재하지 않음)

  1. 최소제곱법 적용
    • ATAxˉ=ATbA^TA{\bf \bar x} = A^T{\bf b}를 생각하고, xˉ=[mˉbˉ]{\bf \bar x} = \begin{bmatrix} \bar m\\ \bar b \end{bmatrix}를 구한다
profile
꾸준하게

0개의 댓글