sujikim-hattoo.log

sujikim-hattoo.log

[DL] YOLO 모델은 대체 무엇일까(주요 특징과 장점 위주)

SujiKim-hattoo·2025년 8월 31일

DeepLearningBasic

DL Basic

목록 보기

7/8

You only live once라는 의미로 익숙하지만
딥러닝에서 이 단어는 완전히 다른 의미로 쓰인다.

You Only Look Once

한 번밖에 볼 수 없다 즉, 단 한 번만 보면 된다는 뜻의 모델.
과연 이 모델이 뜻하는 '단 한번'이란 무엇일까?

역사

먼저 이 YOLO는 2015년 JosephRedmon과 Ali Farhadi가 개발한 Darknet 프레임워크에서 처음 소개되었다. 지금은 2025년 2월에 출시된 YOLOv12가 최신 버전이며 계속해서 발전해왔다.

정의

객체 감지(Object Detection)분야의 대표적인 모델로,'실시간(real-time)' 감지가 주목적이다. 실시간으로 객체 위치를 찾고(Localization) + 동시에 그것이 무엇인지 분류하는(Classification) 작업이 실시간으로 이루어진다는 것이다.

작동 방식

바로 여기서 단 한 번의 순전파로 모든 작업을 완료한다. 전체 이미지를 한 번에처리하여 위치 감지와 분류를 동시에 수행하는 한 단계의 작업
<-> R-CNN: 이미지에서 관심 영역(RoI)을 먼저 찾은 뒤 그 다음 각 영역마다 분류 작업을 수행하는 두 단계의 작업

특징

전체 이미지에 단일 신경망 적용
-> 신경망 예측을 위해 단 한 번의 전방 전파 통과만 필요 <-> R-CNN: 단일 이미지 수천 번의 통과 필요
실시간 처리능력 -> 빠르게 지나가는 차량 감지 / 교통 패턴 분석/산불 위험 감지/동물 식별/위험 행동 모니터링 등 다양한 분야에서 활용됨

장점

빠름 -> 초당 수십 프레임의 비디오 처리가 가능해서 실시간 추적에도 유용하다.
지속적인 정확도 향상 -> 버전업마다 개선 중(e.g., YOLO11은 YOLOv8m대비 22% 적은 파라미터로 더 높은 mAP 달성)
mAP란? mean Average Precision의 줄임말로 객체 감지 정확도를 측정하는 대표 지표를 의미
우수한 접근성 -> 오픈소스여서 접근성과 활용성이 뛰어나고 간단한 API로도 쉽게 사용이 가능하다.

한 줄 정리
: YOLO 는 단 한번의 순전파로 실시간 객체 감지 분야에 혁신을 가져와 이미지의 처리 속도와 정확도를 높였습니다.

참고
https://en.wikipedia.org/wiki/You_Only_Look_Once#cite_note-:2-1
https://blog.roboflow.com/guide-to-yolo-models/

˗ˋˏ 그럼에도 불구하고 ˎˊ˗

이전 포스트

[Why] 왜 이미지를 모델에 입력할 때 리사이징과 정규화가 필요할까?

다음 포스트

[DL] mAP은 무엇이고 어디어디에서 쓰일까?

0개의 댓글