R-CNN 논문 및 정리

우수민·2021년 3월 23일

논문정리

논문 정리

목록 보기

3/10

R-CNN이란?

: CNN을 이용한 첫 알고리즘으로 R-CNN은 Regions with CNN features의 약자이다.

R-CNN의 기본개념은 간단하게 아래의 예시처럼 이미지를 넣었을때 이미지 안에서 어떤 물체가 어디에 존재하는지 찾는 알고리즘이다.

전반적인 과정

1. Image Input : takes an input image
2. Extract region proposal(~2k) : extracts around 2000 bottom-up region proposals(물체가 있을법한 2천개의 지역 추출)
++ region proposals : 바운딩 박스가 어디에 위치해 있어야 하는지 신경망 제안하는 절차
3. Compute CNN features : computes features for each proposal using a large convolutional neural network (CNN)
4. Classify regions : classifies each region using class-specific linear SVMs
이다.

RCNN은 물체가 있을 법한 2천개의 지역의 도출로부터 4096차원의 특성 벡터를 도출해 낸다. 위의 이미지처럼 선택적 탐색은 초기의 작은 크기의 세분화 영역을 설정하고, 이를 계층적으로 그룹 알고리즘을 사용하여 병합하고, 이를 바탕으로 영역을 제안하는 단계로 진행된다.