[CS231n] Lecture1

박정훈·2021년 8월 23일
0

CS231n

목록 보기
1/2

Introduction to Convolutional Neural Networks for Visual Recognition


A breif history of computer vision

  1. Biological vision: 시각을 가진 이후로 개체 수가 급증했다는 설 (Evolution's Big Bang)

  2. Mechanical vision(camera):

  • 간단한 카메라 역사
  • 시각의 원리 규명
  • Vision process 정리(David Marr)
  • Feature-based Object Recognition: criticial feature을 찾아 매칭
  • Spatial Pyramid Matching: 이미지에는 해당 장면이 어떤 종류인지 알려주는 clue가 존재한다!
  1. 데이터셋의 확장
  • 1900년대 후반에서 2000년대 초로 넘어오면서, 카메라의 성능이 비약적으로 향상
  • PASCAL Visual Object Challange
  • ImageNet: 기존 방법(SVM 등)은 train시 overfit될 가능성이 너무 높아, train dataset의 complexity가 중요했음. 이는 ImageNet 데이터셋을 만들게된 계기가 됨.
  1. 성능 향상
  • The Image Classification Challenge에서 2015년에 인간의 분류 능력 초월
  • 2012년에 도입된 CNN이 큰 영향을 미침

CS231n overview

  • Image Classificaiton에 주목
  • visual recognition problems에는 여러가지 있음
    • obj detection: classficiation과는 약간 다름(위치 찾아서 박스까지 그려줘야함)
    • img captioning: img를 보고 설명을 해줘야함
    • etc
  • CNN have become an important tool for obj recognition
    • 2010: hierarchical method 통한 후 SVM에 집어넣음
    • 2012: 7 layer CNN(alexnet)으로 히트
    • 이후: layer수와 장비 향상 -> 정확도 향상
  • CNN이 2012년이 돼서야 도입된 이유
    • LeCun의 CNN(1998)
    • 왜 2012돼서야?
        1. increasing computation
        1. size of data
  • The quest for visual intelligence goes far beyond obj recognition
    • segmentation, activity recognition, vr 관련 문제 등
    • 사람은 0.5s만 보고도 사진에 대해 굉장히 많은 이야기를 할 수 있음
    • 사람은 사진의 맥락을 이해할 수 있음(사진 속 숨은 맥락(대통령인 오바마가 장난을 치는 상황 등))
profile
배우는 중입니다

0개의 댓글