CS229 | Lecture 2.5 Linear Algebra

HAIM BIN·2023년 7월 3일

Stanford CS229: Machine Learning

목록 보기

3/8

조금 전 강의를 위해 알아둬야 할 중요한 선형대수 지식을 정리해보겠다.
https://cs229.stanford.edu/ 이곳에 있는 강의 노트를 참고했다.
먼저 모든 벡터는 열벡터로 가정한다.

벡터곱의 표현

$A \times B$ 를 4가지 방식으로 표현할 수 있다. $A \in R^{}$
1.A의 행벡터와 B의 열벡터의 내적
2.A의 열벡터와 B의 행백터의 외적
3.A와 B의 열벡터의 곱표현
4.A의 행벡터와 B의 열벡터의 곱표현

A의 행벡터와 B의 열벡터를을 차례대로 내적해서 표현하는 가장 일반적인 형태
A의 열벡터와 B의 행벡터를 차례대로 외적해서 표현하는 형태
A와 B의 열벡터를 곱하는 형태
A의 행벡터와 B를 곱하는 형태

A와 B의 행벡터를 곱하는 형태를 다루지 않는 이유는 차원이 맞지 않기 때문이다.

행렬의 결합법칙

$A \in R^{m\times n}$ , $B \in R^{n\times p}$ , $C \in R^{p\times q}$
라고 가정했을 때
$AB \in R^{m\times p}$ , $(AB)C \in R^{m\times q}$ 이다.
그리고 또
$BC \in R^{n\times q}$ , $A(BC )\in R^{m\times q}$ 이다.

어떤 행렬곱을 먼저 계산하더라도 차원이 같다.

다음으로 행렬곱을 수열의 합 형태로 나타내보겠다.

행렬곱을 수열의 합 형태로 나타내는 예시를 보이겠다.
$(AB)_{ij} = \sum_{k=1}^{n}A_{in}B_{nj}$ 다음과 같이 쓸 수 있다.
이를 소급해서 적용하면 $(AB)C = A(BC)$ 임을 알 수 있다.

$((AB)C)_{ij} = \sum_{k=1}^{p}(AB)_{ip}B_{pj} \\= \sum_{k=1}^{p}(\sum_{l=1}^{q}A_{il}B_{lk})C_{kj} \\= \sum_{l=1}^{q}\sum_{k=1}^{p}A_{il}B_{lk}C_{kj} \\= \sum_{l=1}^{q}\sum_{k=1}^{p}A_{il}(B_{lk}C_{kj}) \\ = \sum_{l=1}^{q}A_{il}(BC)_{lj} \\ = (A(BC))_{ij}$

이러한 규칙은 선형대수의 다양한 성질을 증명할 때 쓰이므로 알아두는 것이 좋다.

Quadratic form

$X^\intercal A X$ 를 quadratic form 이라고 부른다.
여기서 $X$ 는 $1\times n$ 크기의 열벡터이다. 그리고 $A$ 는 당연하지만 $n \times n$ 크기의 정사각형 벡터이다. 그리고 이 식의 결과값으로는 scalar가 나온다. 일반적으로 $A$ 를 symmetric 하다고 가정한다. 이는 문제를 단순화 하기 위함이다.
symmetric 하다는 것은 전치를 시키더라도 자기 자신이라는 것을 의미한다.