원본의 sparse한 데이터를 만드는 것
Multiple objects에서 각각의 object에 대해 Classification + Localization을 수행하는 것
RCNN
입력 이미지에 selectiva search 알고리즘을 적용하여 물체가 있을만한 박스 2천개를 추출
모든 박스를 227X227 크기로 resize
이미지넷 데이터를 통해 학습시켜놓은 CNN을 통과시켜 4096차원의 특징 벡터를 추출
추출된 벡터를 클래스마다 학습시켜놓은 SVM classifier를 통과
가장 물체를 잘 표현하는 박스찾기(Non-Maximum Supperssion)
바운딩 박스 리그레션을 적용하여 박스의 위치 조정
단점 : 학습이 여러 단계로 진행되어 많은 시간과 GPU 계산 용량이 요구됨.
Fast RCNN
RCNN의 단점을 해결한 모델이라고 볼 수 있음.
Object Detection과 유사하지만, 다른점은 object의 위치를 bounding box가 아닌 실제 edge로 찾는 것
형태와 모양 등을 변형하여 데이터를 증강시키는 방법