YOLO 모델의 주요 특징과 장점

Youngho LEE·2025년 7월 6일

YOLO (You Only Look Once)

이미지를 한번만 보고 바로 물체를 검출하는 딥러닝 기술을 이용한 물체 검출 모델이다.
YOLO 이전에 등장한 모델들은 이미지를 여러번에 걸쳐서 확인하며 동작하였기 때문에 상대적으로 한장의 이미지를 처리하는데 많은 시간이 소요되었다.
하지만, YOLO 모델은 이미지를 한번만 보고 바로 Object Detection을 수행하기 때문에 이미지에 대해 빠른 속도로 Object Detection을 수행할 수 있다는 장점이 있다. 이는 동영상처럼 실시간으로 Object Detection을 수행해야하는 경우에 속도가 느린 다른 모델에 대비해서 엄청난 장점이 될 수 있다.

YOLO Architecture

처음 input image가 들어오면 이를 7x7 Grid cell로 나눈 뒤 각 그리드 셀 별로 2개의 Bounding Box를 예측하게 된다. 그럼 결과적으로 1장의 이미지에 대해 98개의 Bounding Box를 예측하게 되고, 마지막으로 NMS(Non-Maximum Suppression)이라는 과정을 통해서 최종적으로 확률값이 높은 예측결과만을 남기게 된다.

YOLO Feature

  • 이미지 전체를 한번만 본다.
    • 이전의 R-CNN 계열의 방식처럼 이미지를 여러장 분할해 여러번 분석하는 일을 하지 않는다. YOLO는 원본 이미지 그대로를 CNN에 통과시킨다.
  • 통합된 모델을 사용한다.
    • 기존에는 region proposal, feature extraction, classification, bbox regression 등의 작업을 별도로 진행했다면, YOLO는 한 모델만을 사용해 앞의 과정들을 한 번에 진행한다. 따라서 속도가 이전 모델들에 비해 상대적으로 빠르고 그로 인해 실시간으로 객체를 탐지할 수 있다.
  • 이미지 전체를 처리하기에 객체 주변정보까지 학습하여 background error가 적다.
  • train에서 보지 못한 새로운 이미지에 대해서도 검출 정확도가 높다.

출처
blog
blog

profile
개발자

0개의 댓글