Deep Neural Networks (DNN)을 학습시켜 문제를 해결하는 것
• 많은 문제들이 굉장히 높고 복잡한 차원의 데이터를 다루고 있지만(이미지, 텍스트, 음성), 기존의 선형 데이터 분석 기법으로는 한계가 명확함
• 비선형 모델로, 기존 머신러닝에 비해 패턴 인식 능력이 월등함
(univarsal approximation theorem)
• 이미지나 텍스트, 음성과 같은 분야들에서 비약적인 성능 개선을 만듦
• 기존 머신러닝과 달리 hand-crafted feature가 필요 없음
• 단순히 raw 값에 최소한의 전처리(ex : scaling)를 수행해 넣는 것만으로, 자동으로 특징(feature)을 학습함
• 구현이 용이하지만 사람이 해석하기 난해하다는 단점도 존재
기존 패러다임
• Hand-crafted feature를 추출 (가정을 도입)하여 머신러닝 모델에 넣고 학습
• 기존 머신러닝은 주로 선형 또는 낮은 차원의 데이터를 다루기 위해 설계되었음 (Kernel 등을 사용하여 비선형 데이터를 다룰 수 있지만, 한계가 명확함)
• 여러 단계의 sub-module로 이루어져 있었음 e.g.음성인식,기계번역 등
새로운 패러다임
• Raw 값을 신경망에 넣으면, 자동으로 특징(feature)을 학습
• 하나의 task에 대해서, 하나의 신경망 모델이 존재하는 end-to-end 방식
• 열린 문화와 빠른 트렌드 변화 (오픈 소스 문화, 빠른 논문 공유)