모델(Model): YOLO(You Only Look Once) 시리즈 기술 진화 정리 (v1~v12)

calico·2025년 12월 31일

Artificial Intelligence

Artificial Intelligence

목록 보기

147/175

https://blaewood.tistory.com/47

YOLO (You Only Look Once) 시리즈 기술 진화 정리

YOLO는 단일 객체 탐지 모델이 아니라, “실시간 객체 탐지를 가능하게 한 설계 철학과 구현 계열”로 이해하는 것이 정확하다.

공식 논문 계보: YOLOv1 ~ YOLOv4
산업·커뮤니티 확장 계보: YOLOv5 이후 (YOLO-style detectors)

특히 YOLOv9~YOLOv12는 단일 연구 계보가 아닌 다양한 구현체의 네이밍이 혼재되어 있으므로,
학술적 문서에서는 “YOLO-style 최신 구현체”라는 표현이 가장 안전하다.

1. YOLOv1 (2015) — 개념 혁신기

제작: Joseph Redmon et al.
핵심 개념
- 객체 탐지를 classification + localization의 결합 문제가 아닌
- 하나의 regression 문제로 재정의
구조 특징
- 24 Convolution layers + 2 Fully Connected layers
- Leaky ReLU, Dropout 사용
- 입력 이미지를 ( S \times S ) grid로 분할
- 각 grid cell이 ( B )개의 bounding box와 class probability 예측
핵심 한계
- 하나의 grid cell이 하나의 객체만 책임지는 구조
- 작은 객체 및 밀집 객체 탐지에 구조적 제약

정리

YOLOv1의 한계는 성능 문제가 아니라 문제 정의 방식의 한계였다.

2. YOLOv2 / YOLO9000 (2016) — 구조 보강기

주요 개선 사항
- Batch Normalization 도입
- Anchor Box 도입
- Multi-scale training
- 고해상도 입력 지원
YOLO9000의 핵심
- 단순히 “9,000개 클래스 탐지”가 아니라
- Hierarchical label space + detection/classification joint training
의의
- YOLO가 Faster R-CNN 계열과 개념적으로 수렴
- 실시간성과 정확도의 균형점 진입

3. YOLOv3 (2018) — 실전 안정화 단계

백본 네트워크: Darknet-53
- Residual connection 기반의 안정적 학습
핵심 개선:
- 다중 스케일 예측 (FPN과 유사한 구조)
- Objectness score 명시적 분리
- Anchor box 다양화
의의
- YOLO가 연구용을 넘어 산업 적용 가능한 detector로 자리 잡음

4. YOLOv4 (2020) — 최적화 집대성

제작: Alexey Bochkovskiy et al.
구조 특징
- CSPDarknet53
- Mish activation
핵심 개념
- Bag of Freebies: 추론 비용 증가 없이 성능 향상
- Bag of Specials: 소폭 비용으로 큰 성능 개선
의의
- 새로운 이론보다는 기존 기법의 체계적 검증과 엔지니어링 완성도
- 논문 기반 YOLO 계보의 사실상 종착점

5. YOLOv5 (~2021) — 패러다임 전환

제작: Ultralytics
특징
- PyTorch 기반
- CLI, 학습 파이프라인, 배포 도구 내장
- s/m/l/x 등 다양한 모델 스케일 제공
중요한 점
- 공식 논문은 없으나 MLOps 친화성으로 사실상 산업 표준 구현체
의의
- YOLO를 연구 모델에서 제품화 가능한 프레임워크로 전환

6. YOLOR · YOLOX (2021) — 설계 실험기

YOLOX

Anchor-free 방식 채택
핵심은 anchor 제거가 아니라 SimOTA 기반 label assignment

YOLOR

Multi-task learning 실험
실제 산업 채택은 제한적

정리

이 시기는 YOLO 설계 철학의 다양한 실험 분기점이다.

7. YOLOv6 · YOLOv7 · DAMO-YOLO (2022) — 기업 주도 최적화

YOLOv6 (Meituan)
- EfficientRep, Rep-PAN
- 엣지 및 산업 배포 지향
YOLOv7
- Trainable bag-of-freebies
- 논문 기반 YOLO-style detector의 정점
DAMO-YOLO (Alibaba)
- NAS 기반 구조 탐색
- 재현성은 상대적으로 낮음

정리

YOLO는 이 시점부터 논문 브랜드가 아닌 산업 패턴이 된다.

8. YOLOv8 (2023) — 프레임워크화 완성

제작: Ultralytics
주요 변화
- Anchor-free detection
- C2f 모듈
- Mosaic augmentation 개선
지원 태스크
- Detection, Segmentation, Pose
의의
- YOLO를 단일 detector가 아닌 범용 Vision SDK로 확장

9. YOLOv9 ~ YOLOv12 (2024–2025) — 최신 구현체 정리

중요: 아래 버전들은 단일 공식 계보가 아니다.

YOLOv9 (2024)
- Transformer 기반 feature extraction 일부 도입
YOLOv10 (2024)
- Quantization-aware training
- Edge AI 최적화
YOLOv11 (2025)
- Detection, Classification, Pose, OBB 등 멀티태스크 통합
- 성능 수치는 구현체 의존
YOLOv12 (2025)
- Attention 중심 설계
- 낮은 latency 지향

학술 문서에서는 “YOLO-style 최신 구현체”로 통칭하는 것이 바람직하다.

10. 버전별 요약 테이블

버전	연도	핵심 특징
YOLOv1	2015	Detection을 regression으로 정의
YOLOv2	2016	Anchor, BN, YOLO9000
YOLOv3	2018	Darknet-53, 다중 스케일
YOLOv4	2020	CSP, Mish, 최적화 집대성
YOLOv5	~2021	PyTorch, MLOps 친화
YOLOR / YOLOX	2021	설계 실험
YOLOv6	2022	경량·산업 최적화
YOLOv7	2022	논문 기반 YOLO 정점
DAMO-YOLO	2022	NAS 기반
YOLOv8	2023	Anchor-free, SDK화
YOLOv9	2024	Transformer 일부 도입
YOLOv10	2024	Edge AI 최적화
YOLOv11	2025	멀티태스크 통합
YOLOv12	2025	Attention 중심

YOLO의 진화 단계

개념 혁신: v1 ~ v3
최적화·산업화: v4 ~ v7
플랫폼화: v8 이후

YOLO는 더 이상 하나의 모델이 아니라 실시간 객체 인식을 위한 설계 철학과 구현 생태계이다.

목적별 추천 가이드

목적	추천
이론·논문 비교	YOLOv3, YOLOv4
산업 배포	YOLOv5, YOLOv8
엣지 디바이스	YOLOv6, YOLOv10
멀티태스크	YOLOv8 이후
최신 연구 트렌드	YOLO-style + Transformer 혼합

개인 블로그

이전 포스트

Google: Agentic Design Patterns 도서 소개

다음 포스트

CSPNet : CNN의 학습능력을 향상 시킬 수 있는 새로운 Backbone

0개의 댓글