사람의 지능을 컴퓨터 시스템으로 구현하는 것
Perception (지각 능력)
사람은 오감(시각, 청각, 촉각, 미각, 후각)을 통해 사회와 상호작용을 한다. 이러한 사람의 상호작용을 생각해 보았을 때 지각 능력의 구현이 가장 우선시되어야 함!
그 중 시각에 가장 많이 의존하고 있음

우리가 해야할 일은 컴퓨터에게 세상을 바라보는 눈을 만들어주는 것
Visual Perception & Intelligence
Input : visual data (image or video)
딥러닝의 도입
머신러닝이 image classification의 주요 메소드였을 때는 전문가(사람)가 특징을 추출하는 과정이 필수적이었으나 딥러닝으로 넘어가면서 사람이 관여하지 않고 컴퓨터가 직접 기준을 세우고 분류하여 input에서 바로 output을 도출할 수 있게 되었으며 머신러닝으로 해결할 수 없었던 문제들을 해결할 수 있게 됨