선형대수학과 인공신경망(ANN)

김승혁·2023년 8월 7일

DL

목록 보기

1/7

신경망은 어떻게 동작할까?

선형 대수 기초 – 행렬이란 무엇인가?

선형 대수학(linear algebra) : (데이터의) 공간을 분석하는 학문 (e.g. 3차원)
행렬(Matrix) → 숫자를 네모나게 모은 것. Vector(데이터)들의 묶음
Matrix를 쌓으면? 행렬을 묶은걸 또 쌓으면?

Matrix → Vector를 변환하는 역할

행렬 변환과 인공 신경망

인공신경망 분류기는 어떻게 동작하는가?

인공신경망과 좌표변환

인공신경망과 좌표변환 + Sigmoid

비선형 함수의 필요성

Simple ANN example

코드예시

딥러닝이란?

원본 데이터(공간)를 선형 또는 비선형으로 변환하여
목적에 부합하는 잠재공간에 대응시킬 수 있는 parameter들을 찾는 과정

잠재공간 (Latent space) : Z
• 목적에 맞게 변형된 공간
• 데이터를 잘 표현할 수 있게 재구성된 공간
• 데이터의 잠재된 의미가 드러난 공간

딥러닝은 곧 차원 축소(변환)이다.
딥러닝 모델의 개념:
딥러닝(MLP)은 사실 비선형적인 boundary를 찾는 것이 아닌
데이터를 구기고 돌리고 늘려서 선형적인 boundary에 맞추는 것이다.

잠재공간(Latent Space) 이란?

•데이터를 잘 표현할 수 있는 구성된 공간을 latent space(z)라고 함 → Representation Learning (T-sne, U-MAP, autoencoder)
• Observation Space에서 latent Space로 치환하는 과정을 Embedding이라고도 함
•잠재 공간(latent space)은 실제 관찰 공간(observation space)보다 작을 수 있음

참고:https://www.baeldung.com/cs/dl-latent-space

잠재공간을 응용한 딥러닝 모델 - AutoEncoder

참고: https://argmax.ai/blog/vhp-vae/
Automatic Chemical Design Using a Data-Driven Continuous Representation of Molecules

Applications using Latent Space

데이터 압축, 생성

이상치 탐색

참고 : https://www.kaggle.com/code/robinteuwens/anomaly-detection-with-auto-encoders/notebook
(2018) Deep One-Class Classification, Lukas Ruff et al

Frame interpolation

참고: Time Lens: Event-based Video Frame Interpolation
https://argmax.ai/blog/vhp-vae/

탐색 / Interpolation

Contrastive/Metric learning

기존 Classification의 문제점들

• MNIST classification하기 위해서는 최종적으로 몇 차원이 필요한가? class 별 데이터 수는?
• CIFAR100 classification하기 위해서는 몇 차원이 필요한가? class 별 데이터 수는?
• 회사 직원 얼굴 인식을 하기 위해서는 몇 차원이 필요한가? class 별 데이터 수는

우리가 모델을 구축하고 데이터 수집부터 기획해야하는 입장이라면?