👉 현대 기계학습을 주도
📌 경사 소멸 문제(gradient vanishing problem)
역전파 과정에서 활성함수에 따라 미분에 의해 gradient 값이 소멸되는 문제
👉 활성함수로 로지스틱 시그모이드나 하이퍼볼릭 탄젠트 함수를 사용할 경우 문제 발생 가능!
기계학습의 새로운 전환
과거 기계학습 - 전통적인 다층 퍼셉트론
현대 기계학습 - 심층학습
특징 벡터를 신경망에 입력 (종단간 학습)
👉 학습에 의해 자동적으로 데이터로부터 특징 추출 → 표현학습(representation learning)
깊은 신경망의 표현학습 (또는 특징학습 (feature learning)
👉 표현 학습이 강력해짐에 따라 기존 응용에서 획기적인 성능 향상
깊은 다층 퍼셉트론(DMLP 혹은 deep MLP) 구조
DMLP의 가중치 행렬
DMLP의 동작
DMLP 학습은 기존 MLP 학습과 유사
(DMLP는 경사도 계산과 가중치 갱신을 더 많은 층에 걸쳐 수행)
DMLP를 위한 미니 배치 스토캐스틱 경사 하강법
주요 알고리즘의 개선