선형대수학이란 어떤 학문이며, 왜 머신러닝에 필요한지 설명해보세요.
선형대수학이란?📊
선형대수학은 수학의 한 분야로, 벡터(vector), 행렬(matrix), 그리고 이들의 연산을 다루는 학문이다. 선형대수학은 공간(공간상에서의 위치, 방향)을 수학적으로 표현하고, 여러 차원에서 일어나는 선형 변환(linear transformation)을 분석하는 데 사용된다.
선형대수학의 기본 개념
-
벡터(Vector): 크기와 방향을 가지는 숫자의 집합
[5, 3, 7]

-
행렬(Matrix): 숫자의 집합을 2차원으로 구성한 것, 행과 열로 구성된다.
[[5, 3, 7], [1, 3, 5]]
-
텐서(Tensor): 다차원 배열로 구성된 데이터. 백터는 1차원 텐서, 행렬은 2차원 텐서라고 볼 수 있다.
머신러닝이란?
머신러닝은 컴퓨터 시스템이 데이터를 분석하고 학습하는 기술이다. 인간의 명시적인 지시 없이도 스스로 패턴을 인식하고 결정을 내리는 인공지능(AI)의 한 분야이다. 따라서 머신러닝의 핵심 목표는 데이터 기반 예측과 패턴 인식이다.
선형대수학이 머신러닝에 필요한 이유는?🤔
선형대수학은 머신러닝에서 핵심적인 개념과 기법을 제공하는 수학 분야 중 하나이다.
| 머신러닝 | 선형대수학 개념 |
|---|
| 데이터 표현 | 백터와 행렬 |
| 선형 회귀 | 행렬 곱셈과 선형 변환 |
| 신경망 연산 | 행렬 곱셈 |
| 이미지 처리 | 행렬 연산 |
| 차원 축소(PCA) | 고유값과 고유벡터 |
- 데이터 표현
예를 들어, 사람의 키와 몸무게 데이터를 저장할 때
[170, 65], [160, 50] 처럼 표현할 수 있다. 이때, 여러 사람의 데이터를 모으면 행렬이 된다. 이처럼 백터와 행렬로 데이터를 표현할 수 있다.
- 선형 회귀
선형 회귀는 데이터를 직선으로 모델링하는 방법이다. 데이터를 곱하고 더해서, 새로운 값을 예측하는 과정이라고도 할 수 있다.
예를 들어, 집 크기에 따라 집값이 어떻게 변하는지 직선으로 예측할 수 있다. 이때, 행렬 곱을 통해 데이터와 가중치를 계산하는 수학적 연산을 사용한다.
- 신경망 연산
신경망은 데이터 여러 층(layer)을 거치면서 변환한다. 이때, 매번 행렬 곱셈을 통해 데이터를 처리한다.
예를 들어, input으로 고양이 사진을 넣었을 때 신경망은 사진의 픽셀 값을 행렬로 변환한 뒤, 여러 층을 통과하며 행렬 곱셈을 반복한다. 이러한 과정을 거쳐 사용자에게 "고양이"라는 답을 준다.
- 이미지 처리
이미지는 픽셀(pixel)로 이루어져 있고, 이 픽셀 값들은 숫자로 표현된다. 이미지의 밝기나 색상을 바꾸는 것은 행렬을 연산하는 과정이라고 볼 수 있다.
- 차원 축소(PCA)
너무 복잡한 고차원 데이터는 중요한 부분만 남기고, 불필요한 부분은 없애는 과정이 필요하다. 이때, PCA(주성분 분석) 방법이 사용되며, 고유값과 고유벡터 개념이 사용된다.