모델(Model): YOLO(You Only Look Once) 시리즈 기술 진화 정리 (v1~v12)

calico·2025년 12월 31일

Artificial Intelligence

목록 보기
147/175

https://blaewood.tistory.com/47

YOLO (You Only Look Once) 시리즈 기술 진화 정리


YOLO는 단일 객체 탐지 모델이 아니라, “실시간 객체 탐지를 가능하게 한 설계 철학과 구현 계열”로 이해하는 것이 정확하다.

  • 공식 논문 계보: YOLOv1 ~ YOLOv4
  • 산업·커뮤니티 확장 계보: YOLOv5 이후 (YOLO-style detectors)

특히 YOLOv9~YOLOv12는 단일 연구 계보가 아닌 다양한 구현체의 네이밍이 혼재되어 있으므로,
학술적 문서에서는 “YOLO-style 최신 구현체”라는 표현이 가장 안전하다.



1. YOLOv1 (2015) — 개념 혁신기


  • 제작: Joseph Redmon et al.

  • 핵심 개념

    • 객체 탐지를 classification + localization의 결합 문제가 아닌

    • 하나의 regression 문제로 재정의

  • 구조 특징

    • 24 Convolution layers + 2 Fully Connected layers

    • Leaky ReLU, Dropout 사용

    • 입력 이미지를 ( S \times S ) grid로 분할

    • 각 grid cell이 ( B )개의 bounding box와 class probability 예측

  • 핵심 한계

    • 하나의 grid cell이 하나의 객체만 책임지는 구조

    • 작은 객체 및 밀집 객체 탐지에 구조적 제약

정리

YOLOv1의 한계는 성능 문제가 아니라 문제 정의 방식의 한계였다.



2. YOLOv2 / YOLO9000 (2016) — 구조 보강기


  • 주요 개선 사항

    • Batch Normalization 도입

    • Anchor Box 도입

    • Multi-scale training

    • 고해상도 입력 지원

  • YOLO9000의 핵심

    • 단순히 “9,000개 클래스 탐지”가 아니라

    • Hierarchical label space + detection/classification joint training

  • 의의

    • YOLO가 Faster R-CNN 계열과 개념적으로 수렴

    • 실시간성과 정확도의 균형점 진입



3. YOLOv3 (2018) — 실전 안정화 단계


  • 백본 네트워크: Darknet-53

    • Residual connection 기반의 안정적 학습
  • 핵심 개선:

    • 다중 스케일 예측 (FPN과 유사한 구조)

    • Objectness score 명시적 분리

    • Anchor box 다양화

  • 의의

    • YOLO가 연구용을 넘어 산업 적용 가능한 detector로 자리 잡음



4. YOLOv4 (2020) — 최적화 집대성


  • 제작: Alexey Bochkovskiy et al.

  • 구조 특징

    • CSPDarknet53

    • Mish activation

  • 핵심 개념

    • Bag of Freebies: 추론 비용 증가 없이 성능 향상

    • Bag of Specials: 소폭 비용으로 큰 성능 개선

  • 의의

    • 새로운 이론보다는 기존 기법의 체계적 검증과 엔지니어링 완성도

    • 논문 기반 YOLO 계보의 사실상 종착점



5. YOLOv5 (~2021) — 패러다임 전환


  • 제작: Ultralytics

  • 특징

    • PyTorch 기반

    • CLI, 학습 파이프라인, 배포 도구 내장

    • s/m/l/x 등 다양한 모델 스케일 제공

  • 중요한 점

    • 공식 논문은 없으나 MLOps 친화성으로 사실상 산업 표준 구현체
  • 의의

    • YOLO를 연구 모델에서 제품화 가능한 프레임워크로 전환



6. YOLOR · YOLOX (2021) — 설계 실험기


YOLOX

  • Anchor-free 방식 채택

  • 핵심은 anchor 제거가 아니라 SimOTA 기반 label assignment

YOLOR

  • Multi-task learning 실험

  • 실제 산업 채택은 제한적

정리

이 시기는 YOLO 설계 철학의 다양한 실험 분기점이다.



7. YOLOv6 · YOLOv7 · DAMO-YOLO (2022) — 기업 주도 최적화


  • YOLOv6 (Meituan)

    • EfficientRep, Rep-PAN

    • 엣지 및 산업 배포 지향

  • YOLOv7

    • Trainable bag-of-freebies

    • 논문 기반 YOLO-style detector의 정점

  • DAMO-YOLO (Alibaba)

    • NAS 기반 구조 탐색

    • 재현성은 상대적으로 낮음

정리

YOLO는 이 시점부터 논문 브랜드가 아닌 산업 패턴이 된다.



8. YOLOv8 (2023) — 프레임워크화 완성


  • 제작: Ultralytics

  • 주요 변화

    • Anchor-free detection

    • C2f 모듈

    • Mosaic augmentation 개선

  • 지원 태스크

    • Detection, Segmentation, Pose
  • 의의

    • YOLO를 단일 detector가 아닌 범용 Vision SDK로 확장



9. YOLOv9 ~ YOLOv12 (2024–2025) — 최신 구현체 정리


중요: 아래 버전들은 단일 공식 계보가 아니다.

  • YOLOv9 (2024)

    • Transformer 기반 feature extraction 일부 도입
  • YOLOv10 (2024)

    • Quantization-aware training

    • Edge AI 최적화

  • YOLOv11 (2025)

    • Detection, Classification, Pose, OBB 등 멀티태스크 통합

    • 성능 수치는 구현체 의존

  • YOLOv12 (2025)

    • Attention 중심 설계

    • 낮은 latency 지향

학술 문서에서는 “YOLO-style 최신 구현체”로 통칭하는 것이 바람직하다.



10. 버전별 요약 테이블


버전연도핵심 특징
YOLOv12015Detection을 regression으로 정의
YOLOv22016Anchor, BN, YOLO9000
YOLOv32018Darknet-53, 다중 스케일
YOLOv42020CSP, Mish, 최적화 집대성
YOLOv5~2021PyTorch, MLOps 친화
YOLOR / YOLOX2021설계 실험
YOLOv62022경량·산업 최적화
YOLOv72022논문 기반 YOLO 정점
DAMO-YOLO2022NAS 기반
YOLOv82023Anchor-free, SDK화
YOLOv92024Transformer 일부 도입
YOLOv102024Edge AI 최적화
YOLOv112025멀티태스크 통합
YOLOv122025Attention 중심



YOLO의 진화 단계


  1. 개념 혁신: v1 ~ v3

  2. 최적화·산업화: v4 ~ v7

  3. 플랫폼화: v8 이후

YOLO는 더 이상 하나의 모델이 아니라 실시간 객체 인식을 위한 설계 철학과 구현 생태계이다.



목적별 추천 가이드


목적추천
이론·논문 비교YOLOv3, YOLOv4
산업 배포YOLOv5, YOLOv8
엣지 디바이스YOLOv6, YOLOv10
멀티태스크YOLOv8 이후
최신 연구 트렌드YOLO-style + Transformer 혼합



profile
개인 블로그

0개의 댓글