논문링크: 링크텍스트
코드 링크: 링크텍스트
Classification
Classification +Localization
Object Detection : 다중 사물에서 각 사물의 위치와 클래스 찾기
2-stage
예시
1-stage
Instance Segmentation
Selective Search를 이용해 2000개의 Region Proposal 생성
동작과정
Selective search이용하여 2000개의 RoI추출
각 ROI에 대해 warping수행하여 동일 크기의 입력 이미지 변경
Warped image를 CNN에 넣은 후 (forward)이미지 feature추출
해당 feature를 SVM에 넣어 클래스 분류 결과 얻기
해당 feature를 regressor에 넣어 위치 예측
Bounding Box Regression
지역화 성능 높이기 위해 사용
학습 데이터셋: {(P^i, G^i)}
예측 위치: P^i = (Px^i,Py^i,Pw^i,Ph^i)
실제 위치: G^i = (Gx^i,Gy^i,Gw^i,Gh^i)
장점: CNN이용하여 각 Region의 클래스 분류
단점
전체 프레임워크를 End to End 방식으로 학습이 불가(CNN이 고정되어 SVM과 Bounding Box Regression결과로 업데이트 X)하여 Global Optimal Solution찾기 어려움
CPU기반의 Selective Search를 진행해야하므로 많은 시간이 소요됨
SVM, Regressor모듈의 CNN과 분리됨
모든 RoI를 CNN에 넣어야하므로 2000번의 CNN연산 필요(->학습과 평과 과정의 많은 시간이 필요하다)
RoI Pooling Layer
RPN
장점: End to End로 학습이 가능하다.(Feture Extraction, Rol Polling, Region Classification, Bounding Box Regression단계)
단점: CPU수행 속도가 느리다
장점: RPN 제안하여 전체 프레임워크를 End to End학습 가능
단점: 많은 컴포넌트로 구성이 되고, Region Classification 단계에서 각 특징 벡터(feature vector)가 개별적 FC Layer로 Forward가 됩니다.
정의: 물체가 있을 법한 위치를 다양한 형태의 윈도우를 통해서 슬라이딩합니다.
단점: 너무 많은 영역을 해야함
두 바운딩 박스가 겹치는 비율 의미
True Positive 인지 False Positive인지 판단하는 기준
성능 평가 예시: mAP@0.5는 정답과 예측의 IoU가 50% 이상일 때 정답 판단
NMS 계산 예시: 클래스가 같은 것인 IoU가 50%이상일 때 낮은 confidence의 box 제거
Precision
Recall
모든 영역에 대해 전부 사물이 존재한다고 판단한다면..?
확실한 때만 사물 존재가 가능하다고 판단을 한다면..?
깔끔한 정리네요 ㅎㅎ