수 들이 모여있는 개념과 관련된 식을 연구하는 수학의 한 분야
수를 다루는 많은 학문(데이터, 공학, 과학적 분석 등)에서 수의 연산을 빠르고 효과적으로 하기 위해 사용하는 도구!
수의 집합을 기하학적인 형상으로 적용하여 표현
컴퓨터 그래픽스, 엔지니어링, 물리학, 컴퓨터 과학, 머신러닝 등 다양한 분야에서 응융
특히 머신러닝에서는 데이터를 표현하고 변환하는데 필수적인 도구로 사용.
수의 집합 단어 정리

데이터를 벡터와 행렬로 변경해보자.
이처럼 데이터를 벡터 혹은 행렬의 형태로 변환 가능하다.
데이터를 다룰때 더욱 효율적으로 진행할 수 있다.
메트릭도 수의 집합이므로 연산이 가능하다.
행렬의 덧셈과 뻴셈은 같은 크기의 행렬끼리만 가능

행렬의 곱셈은 일반적인 수의 곱과는 다르다.
같은 크기의 행렬에서 각 요소 별로 곱하기하는 연산이 존재하기는 한다.
이를 Element-wise multiplication 라고함.

각 자리에 있는걸 곱해서 행렬로 사용
하나의 행렬이 주어질 때, 행과 열을 바꾼 행렬을 전치 행렬이라고 함
예를 들어
A행렬의 크기 : m x n 일 때, 전치 한다면?
n x m이 된다.
이때 전치된 행렬을 At라고 표기.

대각선 원소는 위의 예시처럼 전치 과정에서 그대로 유지된다.
특정 행렬 A에 어떤 행렬 B를 곱해보니 결과가 항등 행렬(I)이라면? A*B=I
여기서 B를 A의 역행렬 이라고 한다.

모든 행렬이 역행렬을 갖는 것은 아니다.
특정 벡터에 특정 행렬을 곱하게 되었을 때 방향이 바뀐다면
이를 선형 변환이라고 한다.
여기에 특정 행렬(A)를 곱해서 새로운 벡터(v’)를 만들었다고 가정해보자.
그럼 v와 v’는 A행렬에 의해 방향 또는 크기가 바뀔 수 있다.
예를 들어
v=[1 1], A= [0 -1 이라면 Av = [-1 =v’
1 0] 1]
결론적으로

앞서서는 벡터(v)를 기준으로 살펴봤는데, 이번에는 행렬(A)의 입장에서 보자.

여기서 λ는 임의의 상수를 말한다.
이를 해석하자면
위에서 배운 것들을 머신러닝에서 어떻게 사용할 수 있을까?
분산이 많이 된다는 것은 많은 정보력을 갖고 있다고 볼 수 있음.
일반적으로 데이터를 불러오면 행렬의 형태를 가지게 된다.
아래 그래프에서는 제일 많이 벌어진 A의 분산이 고유벡터로 볼 수 있다.

해당 방향으로 얼만큼 분산이 이루어졌는지,
또 분산의 크기를 나타내는 정도가 고유값 λ (람다) 이다.
λ가 작으면 분산의 크기도 작아지고,
λ가 크면 분산의 크기고 커진다.
이러한 고유벡터와 고유값λ은 여러개가 가능하며,
고유값을 기준으로 나열된 고유벡터는 해석력이 큰 방향의 순서를 의미한다.
이 둘은 데이터를 이해하고 계산하는 과정에서 사용된다.
즉, 고유벡터와 고유값은 어느정도의 데이터가 어느 방향으로 있는지를 수치화 할 수 있기 때문에 아주 중요하다.
위 그래프를 다시 한번 보자면
분산 A가 5의 크기,
분산 B가 1.5의 크기라고 했을
방향(고유벡터) : 5
크기(고유값) : A
이런식으로 볼 수 있다.
이후 분산B는 A이후에 채택할 수 있을지 한번 더 확인하는 식으로 진행.