이미지를 한번만 보고 바로 물체를 검출하는 딥러닝 기술을 이용한 물체 검출 모델이다.
YOLO 이전에 등장한 모델들은 이미지를 여러번에 걸쳐서 확인하며 동작하였기 때문에 상대적으로 한장의 이미지를 처리하는데 많은 시간이 소요되었다.
하지만, YOLO 모델은 이미지를 한번만 보고 바로 Object Detection을 수행하기 때문에 이미지에 대해 빠른 속도로 Object Detection을 수행할 수 있다는 장점이 있다. 이는 동영상처럼 실시간으로 Object Detection을 수행해야하는 경우에 속도가 느린 다른 모델에 대비해서 엄청난 장점이 될 수 있다.
처음 input image가 들어오면 이를 7x7 Grid cell로 나눈 뒤 각 그리드 셀 별로 2개의 Bounding Box를 예측하게 된다. 그럼 결과적으로 1장의 이미지에 대해 98개의 Bounding Box를 예측하게 되고, 마지막으로 NMS(Non-Maximum Suppression)이라는 과정을 통해서 최종적으로 확률값이 높은 예측결과만을 남기게 된다.
