YOLO는 단일 객체 탐지 모델이 아니라, “실시간 객체 탐지를 가능하게 한 설계 철학과 구현 계열”로 이해하는 것이 정확하다.
특히 YOLOv9~YOLOv12는 단일 연구 계보가 아닌 다양한 구현체의 네이밍이 혼재되어 있으므로,
학술적 문서에서는 “YOLO-style 최신 구현체”라는 표현이 가장 안전하다.
제작: Joseph Redmon et al.
핵심 개념
객체 탐지를 classification + localization의 결합 문제가 아닌
하나의 regression 문제로 재정의
구조 특징
24 Convolution layers + 2 Fully Connected layers
Leaky ReLU, Dropout 사용
입력 이미지를 ( S \times S ) grid로 분할
각 grid cell이 ( B )개의 bounding box와 class probability 예측
핵심 한계
하나의 grid cell이 하나의 객체만 책임지는 구조
작은 객체 및 밀집 객체 탐지에 구조적 제약
정리
YOLOv1의 한계는 성능 문제가 아니라 문제 정의 방식의 한계였다.
주요 개선 사항
Batch Normalization 도입
Anchor Box 도입
Multi-scale training
고해상도 입력 지원
YOLO9000의 핵심
단순히 “9,000개 클래스 탐지”가 아니라
Hierarchical label space + detection/classification joint training
의의
YOLO가 Faster R-CNN 계열과 개념적으로 수렴
실시간성과 정확도의 균형점 진입
백본 네트워크: Darknet-53
핵심 개선:
다중 스케일 예측 (FPN과 유사한 구조)
Objectness score 명시적 분리
Anchor box 다양화
의의
제작: Alexey Bochkovskiy et al.
구조 특징
CSPDarknet53
Mish activation
핵심 개념
Bag of Freebies: 추론 비용 증가 없이 성능 향상
Bag of Specials: 소폭 비용으로 큰 성능 개선
의의
새로운 이론보다는 기존 기법의 체계적 검증과 엔지니어링 완성도
논문 기반 YOLO 계보의 사실상 종착점
제작: Ultralytics
특징
PyTorch 기반
CLI, 학습 파이프라인, 배포 도구 내장
s/m/l/x 등 다양한 모델 스케일 제공
중요한 점
의의
Anchor-free 방식 채택
핵심은 anchor 제거가 아니라 SimOTA 기반 label assignment
Multi-task learning 실험
실제 산업 채택은 제한적
정리
이 시기는 YOLO 설계 철학의 다양한 실험 분기점이다.
YOLOv6 (Meituan)
EfficientRep, Rep-PAN
엣지 및 산업 배포 지향
YOLOv7
Trainable bag-of-freebies
논문 기반 YOLO-style detector의 정점
DAMO-YOLO (Alibaba)
NAS 기반 구조 탐색
재현성은 상대적으로 낮음
정리
YOLO는 이 시점부터 논문 브랜드가 아닌 산업 패턴이 된다.
제작: Ultralytics
주요 변화
Anchor-free detection
C2f 모듈
Mosaic augmentation 개선
지원 태스크
의의
중요: 아래 버전들은 단일 공식 계보가 아니다.
YOLOv9 (2024)
YOLOv10 (2024)
Quantization-aware training
Edge AI 최적화
YOLOv11 (2025)
Detection, Classification, Pose, OBB 등 멀티태스크 통합
성능 수치는 구현체 의존
YOLOv12 (2025)
Attention 중심 설계
낮은 latency 지향
학술 문서에서는 “YOLO-style 최신 구현체”로 통칭하는 것이 바람직하다.
| 버전 | 연도 | 핵심 특징 |
|---|---|---|
| YOLOv1 | 2015 | Detection을 regression으로 정의 |
| YOLOv2 | 2016 | Anchor, BN, YOLO9000 |
| YOLOv3 | 2018 | Darknet-53, 다중 스케일 |
| YOLOv4 | 2020 | CSP, Mish, 최적화 집대성 |
| YOLOv5 | ~2021 | PyTorch, MLOps 친화 |
| YOLOR / YOLOX | 2021 | 설계 실험 |
| YOLOv6 | 2022 | 경량·산업 최적화 |
| YOLOv7 | 2022 | 논문 기반 YOLO 정점 |
| DAMO-YOLO | 2022 | NAS 기반 |
| YOLOv8 | 2023 | Anchor-free, SDK화 |
| YOLOv9 | 2024 | Transformer 일부 도입 |
| YOLOv10 | 2024 | Edge AI 최적화 |
| YOLOv11 | 2025 | 멀티태스크 통합 |
| YOLOv12 | 2025 | Attention 중심 |
개념 혁신: v1 ~ v3
최적화·산업화: v4 ~ v7
플랫폼화: v8 이후
YOLO는 더 이상 하나의 모델이 아니라 실시간 객체 인식을 위한 설계 철학과 구현 생태계이다.
| 목적 | 추천 |
|---|---|
| 이론·논문 비교 | YOLOv3, YOLOv4 |
| 산업 배포 | YOLOv5, YOLOv8 |
| 엣지 디바이스 | YOLOv6, YOLOv10 |
| 멀티태스크 | YOLOv8 이후 |
| 최신 연구 트렌드 | YOLO-style + Transformer 혼합 |