Lecture 1 | Introduction to Convolutional Neural Networks for Visual Recognition

피망이·2023년 8월 9일
0

History of Vision

  • 약 5억 4천만년전

    • 눈을 가지고 태어난 첫 동물을 한 호주 연구진이 발견했다고 한다.
    • '본다'는 행위는 삶을 더 윤택하게 해주었을 뿐더러 종으로서 살아남는 것에 큰 기여를 한 만큼 동물들에겐 매우 중요한 포인트이다.
  • 16세기 르네상스 이후

    • pinhole 형태의 카메라가 등장하였고, 오늘날의 카메라 구조와 크게 다를 바 없다.
  • 고양이 눈을 연구한 결과

    • 인간과 매우 비슷한 구조로 이루어진 고양이 시각 체계를 분석해보았다고 한다.
    • 뇌의 시각 피질 중에서도 가장 중요한 세포체를 연구해보니 '보는 행위'는 가장자리를 이해하는 것으로부터 출발하여 점점 그 구조를 확장해 나간다고 한다.
  • The Summer Vision Project

    • 20세기 vision을 연구한 과학자들에 따르면 보는 행위는
      그림으로 따지면 sktech를 하는 것부터 시작해 2.5D로 객체를 배경과 분리하고, 마침내 3D 형태로 인식한다고 한다.

  • Image Segmentation

    • 컴퓨터가 객체를 인식하게 하기 위해 픽셀을 그룹화하여 인식하게 만들었다.
    • 기술은 더욱 발전하여 Adaboost 알고리즘을 활용한 Face detection이 등장했고, 후지 필름이 이 기술을 카메라에 적용하기 시작하였다.

  • Object Recognition

    • 다방면에서 주어진 이미지로 같은 객체라는 것을 매칭하기 위해 연구하기 시작했다.
    • 배경 이미지를 여러 갈래로 쪼개 frequency에 차이를 두는 방법이 있다.
    • 이를 통해 어떤 위치에 무엇이 있는지 벡터 형태로 기록하는 Support Vector Muchine이 등장하였다.

  • ImageNet

    • ImageNet Challenge는 엄청난 양의 이미지 데이터셋을 이용하여 Image Classification 문제를 해결하기 위해 만든 프로젝트였다.

      • 1,000개 가량의 label과 140만개의 데이터셋을 분류하는 문제이다.
    • 등장한 2009년부터 2015년에 이르기까지 오차는 점점 작아져 사람의 오차 5.xx보다 작은 3.xx을 기록하며 챌린지가 마무리되었다.

[출처] CS 231n | Stanford University school of Engineering

profile
물리학 전공자의 프로그래밍 도전기

0개의 댓글