[ML] 딥러닝의 깊이 있는 이해를 위한 머신러닝 13-1 (K-MOOC)

daeungdaeung·2021년 8월 24일

Machine-Learning

목록 보기

23/25

DNN: 전통적인 머신러닝 기법들의 총집합체
DNN 사용이유
- 비선형 문제 해결
- Overfitting 문제 해결
  - convolution filter 등으로 feature 를 뽑았음에도 비선형성이 복잡하게 남아 있는 경우 Kernelization 을 활용합니다.
  - 비선형성 해결을 위해 모델을 키우고 복잡한 커널 적용 시 overfitting 문제는 점점 더 증가합니다.
딥러닝에서는 복잡한 비선형성을 어떻게 풀 수 있을까?
- 간단한 비선형성들을 융합합니다.
과적합 문제는?
- 데이터를 많이 사용함으로써 문제 해결
- iid condition
  - 학습데이터와 테스트데이터가 어느 정도 동일한 샘플 분포, 데이터 분포를 가진다는 의미
  - 즉 학습데이터가 충분히 크다면 테스트 데이터를 충분히 표현할 수 있습니다.
기존 머신러닝 vs 딥러닝
- 기존: 모든 데이터 중 일부를 선택하여 활용
- 딥러닝: 모든 데이터를 고려

DNN 구성요소

Convolution Layer

Convolution Filter 종류
- Gaussian: 평균을 내는 필터
- Sharpen: 엣지 정보들을 중점적으로 찾아내는 필터
- Laplacian of Gaussian filter

	Traditional Filters	Convolutional Layers
필터의 개수	10~30	64~1024
필터값	사용자가 미리 결정	학습을 통해 취득
필터의 출력 목표값	필요없음	필요하나 모름 (hidden feature 혹은 latent feature)
필터의 입력	입력 이미지	입력 이미지 혹은 앞선 Layer 의 결과

개발자가 되고싶읍니다...