[CS231n] Lecture1

박정훈·2021년 8월 23일

CS231n

목록 보기

1/2

1900년대 후반에서 2000년대 초로 넘어오면서, 카메라의 성능이 비약적으로 향상
PASCAL Visual Object Challange
ImageNet: 기존 방법(SVM 등)은 train시 overfit될 가능성이 너무 높아, train dataset의 complexity가 중요했음. 이는 ImageNet 데이터셋을 만들게된 계기가 됨.

Image Classificaiton에 주목
visual recognition problems에는 여러가지 있음
- obj detection: classficiation과는 약간 다름(위치 찾아서 박스까지 그려줘야함)
- img captioning: img를 보고 설명을 해줘야함
- etc
CNN have become an important tool for obj recognition
- 2010: hierarchical method 통한 후 SVM에 집어넣음
- 2012: 7 layer CNN(alexnet)으로 히트
- 이후: layer수와 장비 향상 -> 정확도 향상
CNN이 2012년이 돼서야 도입된 이유
- LeCun의 CNN(1998)
- 왜 2012돼서야?
  - 1. increasing computation
  - 1. size of data
The quest for visual intelligence goes far beyond obj recognition
- segmentation, activity recognition, vr 관련 문제 등
- 사람은 0.5s만 보고도 사진에 대해 굉장히 많은 이야기를 할 수 있음
- 사람은 사진의 맥락을 이해할 수 있음(사진 속 숨은 맥락(대통령인 오바마가 장난을 치는 상황 등))

배우는 중입니다