[Object Detection] Yolo vs Fast-Rnn

나감빛·2023년 3월 17일

Yolo vs Fast-Rnn

Yolo와 Fast R-CNN은 둘 다 컴퓨터 비전 분야에서 객체 검출 작업을 수행하는 딥러닝 모델입니다. 그러나 학습 속도 측면에서는 차이가 있습니다.

Yolo는 객체 검출을 위해 신경망을 한 번에 전체 이미지에 대해 한 번에 적용합니다. 이러한 방식은 Region Proposal Network (RPN)을 사용하지 않으므로 속도가 빠릅니다. 따라서 Yolo는 실시간 객체 검출 작업에 적합합니다.

반면, Fast R-CNN은 먼저 Region Proposal Network (RPN)을 사용하여 이미지 내에서 객체가 있을 것으로 추정되는 영역을 찾습니다. 그리고 이러한 영역에서 객체를 검출하도록 신경망을 학습시킵니다. 이러한 방식은 객체 검출의 정확도는 높이지만, 학습 속도는 Yolo보다 느립니다.

따라서, Yolo는 실시간 객체 검출 작업에 적합하며, Fast R-CNN은 객체 검출의 정확도를 높이는 데에 초점을 둔 모델입니다.'

RPN?

RPN(Region Proposal Network)은 Faster R-CNN의 핵심 구성 요소 중 하나로, 객체 검출을 위한 후보 영역을 생성하는 데 사용됩니다. 이는 기존의 객체 검출 방법에 비해 정확도와 속도 모두에서 우수한 성능을 보입니다.

하지만, RPN을 사용하면 객체 검출 속도가 느려질 수 있다는 단점이 있습니다. 이는 RPN이 먼저 후보 영역을 생성한 후에, 이를 다시 한 번 신경망을 통과시켜 객체를 검출하기 때문입니다. 이는 기존의 객체 검출 방법보다 더 많은 연산량을 필요로 하므로, 처리 속도가 저하될 수 있습니다.

그러나 최근에는 RPN을 더욱 효율적으로 구현하는 방법들이 제안되고 있습니다. 예를 들어, RPN을 다양한 크기와 비율의 앵커 박스(anchor box)를 사용하여 더욱 정교하게 구성함으로써, 후보 영역을 더욱 정확하게 생성할 수 있습니다. 또한, 네트워크의 최적화와 병렬처리 등을 통해 RPN의 연산 속도를 높이는 방법도 연구되고 있습니다. 따라서, RPN을 사용했을 때객체 검출 속도가 느려진다는 단점을 극복할 수 있는 방안들이 계속해서 연구되고 있습니다.

Yolo using RPN?

YOLO(You Only Look Once)에서는 후보 영역을 생성하는 것이 아니라, 이미지 전체를 한 번에 분석하여 객체를 검출합니다. 따라서 R-CNN 계열의 모델들처럼 selective search나 region proposal network(RPN)을 사용하여 후보 영역을 생성하는 과정이 필요하지 않습니다.

YOLO는 이미지를 일정 크기의 그리드로 분할하고, 각 그리드 셀마다 박스의 중심 좌표와 박스의 크기, 그리고 객체의 클래스 확률을 예측합니다. 이러한 방식을 통해 모든 객체를 한 번에 검출할 수 있어, 빠른 속도와 높은 정확도를 동시에 보장합니다.

따라서 YOLO는 객체 검출을 위해 후보 영역을 생성하는 것이 아니기 때문에, selective search나 RPN과 같은 알고리즘이 없어도 됩니다. 이를 통해 YOLO는 다른 모델보다 더욱 빠른 속도를 보여줍니다.

How to detect in Yolo?

YOLO(You Only Look Once)에서는 객체 검출을 위해 Annotation 데이터를 사용합니다. Annotation 데이터는 이미지 내 객체의 위치, 크기, 클래스 등의 정보를 담고 있는 데이터로, 학습을 위해 필수적입니다.

YOLO에서는 대부분의 다른 객체 검출 알고리즘과 마찬가지로, Annotation 데이터를 수동으로 생성하거나 자동화된 도구를 사용하여 생성합니다. 일반적으로는 먼저 이미지를 수집하고, 이 이미지들을 객체가 있는 영역을 박스로 표시하여 Annotation 데이터를 생성합니다.

자동화된 도구를 사용하는 경우, 대표적으로는 LabelImg, VoTT(Visual Object Tagging Tool), RectLabel 등이 있습니다. 이러한 도구들은 사용자가 객체의 위치를 마우스로 클릭하고 드래그하여 박스로 표시하고, 해당 객체의 클래스를 선택할 수 있도록 인터페이스를 제공합니다. 이러한 작업을 통해 Annotation 데이터를 생성하게 됩니다.

YOLO에서는 이러한 Annotation 데이터를 특정 형식으로 저장하여 모델 학습에 사용합니다. 대부분의 경우, YOLO에서 사용되는 Annotation 데이터는 Pascal VOC, COCO 등과 같은 대표적인 객체 검출 데이터셋의 형식과 유사합니다.

나감빛

이전 포스트

[CNN] ResNet,DenseNet, InceptionResNet, MobileNet 특징 및 비교

다음 포스트