
Localization: 단 하나의 object 위치를 찾아 bounding box로 지정하여 찾음Object Detection: 여러 개의 object들에 대한 위치를 bounding box로 지정하여 찾음Segmentation: Detection보다 더 발전된 형태

Object Detection의 원리를 알아보기 전에 비교적 쉬운 Object Localization 과정을 살펴봄원본 이미지를 VGG/ResNet 등으로 pretrain된 feature extrator를 이용해 추상화된 형태인 feature map을 만든 뒤, ful
Python 기반 주요 이미지 라이브러리 OpenCV 이미지 로딩 imread()를 이용한 이미지 로딩 OpenCV에서 이미지 로딩은 imread('파일명')을 이용. imread('파일명')은 파일을 읽어 넘파이 array로 변환 -> (x, y, z) 세로,가로
Region Proposal 방식에 기반한 Object Detection R-CNN 모델의 Classification Dense layer로 인해 이미지 크기 동일 Region Proposal 수행한 후 도출된 이미지 하나하나에 CNN 연산 적용 RCNN Trai
RCNN 주요 문제점 2000개의 Region 영역 이미지가 CNN으로 입력되면서 Object Detection 수행시간이 오래 걸림 Region 영역 이미지가 Crop/Warp 되어야 함 RCNN 개선 방안 2000개의 Region Proposal 이미지를 CN

SPP Layer를 ROI Pooling Layer로 변경SVM을 Softmax로 변환Multi-task loss 함수로 Classification과 Regression을 함께 최적화Feature Map 상의 임의의 ROI를 고정 크기의 Pooling 영역으로 매핑매핑

Faster RCNN = RPN + Fast RCNNSS(Selective Search) 이후 RoI 방식에서 딥러닝 네트워크인 RPN(Region Proposal Network)데이터로 주어질 피처는 pixel 값. Target은 Ground Truth Boundin

Multi Scale Feature Layer + Anchor BoxSliding window 기법으로 object를 detect하는 방법 중 하나는 이미지의 스케일을 다르게 하여 이미지의 스케일이 크면 작은 object, 스케일이 작으면 큰 object를 detect