이 글은 딥러닝 호형님의 딥러닝 전체 흐름보기 강의를 바탕으로 작성되었습니다.
[ 딥러닝 전체 흐름 ]
- 문제 이해/Data 처리
- 학습 데이터 생성
- 모델 결정
- 모델 구축
- 예측값 산출
- Loss 계산
- parameter 업데이트
- 최적화
타겟
이 무엇인가?딥러닝
이 꼭 필요한가?방해 요소 확인
데이터 구조 및 분포
분석데이터 가공
데이터 형태 변환
편향 방지
test 데이터와 중복
금지충분한
데이터 양샘플링 종류
선택어떤 종류
의 문제인가?
무엇을 최적화
할 것인가?
데이터가 얼마나 큰가
?
모델 종류
- CNN
- 이미지, 자연어 처리 등
- RNN
- 시계열 데이터
- GAN
- latent space로 가짜 데이터를 만들어 가짜/진짜 구별 안되게 학습
- AutoEncoder
- 비지도 학습
- 레이블링이 없고 데이터를 넣으면 레이어를 거쳐 원본과 유사하게 데이터를 생성하는 모델
epoch
, mini batch
layer
, Node
, filter
등 (수,크기 지정)loss function
optimizer
y
실제값, ŷ
예측값기준
이 loss function작아지게 하는 것
이 목표weight
값을 구하는 것이 목표역전파 (Backpropagation)
가장 작은 지점
의 (θ0 , θ1) 값을 구하고자 함.경사하강법 (gradient descent)
loss/정확도
안좋을 경우 조절learning rate
optimizer
: 다양한 optimizer 방법 사용batch
: 몇개씩 data 넣을지filter
: 크기,수layer
: 수node
: 얼마나 가져갈지activation function
overfitting
방지early stopping
regularization
: loss function이 완전히 작아지지 않게끔dropout
: node의 일부를 죽여서 과적합 방지