You only live once라는 의미로 익숙하지만
딥러닝에서 이 단어는 완전히 다른 의미로 쓰인다.
You Only Look Once
한 번밖에 볼 수 없다 즉, 단 한 번만 보면 된다는 뜻의 모델.
과연 이 모델이 뜻하는 '단 한번'이란 무엇일까?
역사
- 먼저 이 YOLO는 2015년 JosephRedmon과 Ali Farhadi가 개발한 Darknet 프레임워크에서 처음 소개되었다. 지금은 2025년 2월에 출시된 YOLOv12가 최신 버전이며 계속해서 발전해왔다.
정의
- 객체 감지(Object Detection)분야의 대표적인 모델로,'실시간(real-time)' 감지가 주목적이다. 실시간으로 객체 위치를 찾고(Localization) + 동시에 그것이 무엇인지 분류하는(Classification) 작업이 실시간으로 이루어진다는 것이다.
작동 방식
- 바로 여기서 단 한 번의 순전파로 모든 작업을 완료한다. 전체 이미지를 한 번에처리하여 위치 감지와 분류를 동시에 수행하는 한 단계의 작업
<-> R-CNN: 이미지에서 관심 영역(RoI)을 먼저 찾은 뒤 그 다음 각 영역마다 분류 작업을 수행하는 두 단계의 작업
특징
- 전체 이미지에 단일 신경망 적용
-> 신경망 예측을 위해 단 한 번의 전방 전파 통과만 필요 <-> R-CNN: 단일 이미지 수천 번의 통과 필요
- 실시간 처리능력 -> 빠르게 지나가는 차량 감지 / 교통 패턴 분석/산불 위험 감지/동물 식별/위험 행동 모니터링 등 다양한 분야에서 활용됨
장점
-
빠름 -> 초당 수십 프레임의 비디오 처리가 가능해서 실시간 추적에도 유용하다.
-
지속적인 정확도 향상 -> 버전업마다 개선 중(e.g., YOLO11은 YOLOv8m대비 22% 적은 파라미터로 더 높은 mAP 달성)
mAP란? mean Average Precision의 줄임말로 객체 감지 정확도를 측정하는 대표 지표를 의미
-
우수한 접근성 -> 오픈소스여서 접근성과 활용성이 뛰어나고 간단한 API로도 쉽게 사용이 가능하다.
한 줄 정리
: YOLO 는 단 한번의 순전파로 실시간 객체 감지 분야에 혁신을 가져와 이미지의 처리 속도와 정확도를 높였습니다.
참고
https://en.wikipedia.org/wiki/You_Only_Look_Once#cite_note-:2-1
https://blog.roboflow.com/guide-to-yolo-models/