YOLO란?
객체 탐지를 하나의 회귀 문제로 정의하여 수행하는 딥러닝 모델
- 이미지를 한 번만 신경망에 입력하여 객체의 위치와 클래스를 동시에 예측하는 단일 단계(Single-Stage) 탐지 모델
주요 특징과 장점
1. 단일 단계(Single-Stage) 구조
- 후보 영역(Region Proposal) 생성 과정이 없음
- 하나의 네트워크에서 위치, 신뢰도, 클래스를 동시에 예측
→ 추론 시간이 짧아져 실시간 처리가 가능해짐
2. Grid 기반 예측 방식
- 입력 이미지를 일정한 격자(Grid)로 분할
- 각 grid cell이 bounding box, objectness score, class probability를 예측
→ 각 grid cell이 담당 영역 내에서 예측하므로, 회귀 범위를 줄여 위치 예측을 안정화하고 출력 구조를 단순하게 만듦.
3. End-to-End 학습
- 객체 위치 예측과 분류를 하나의 손실 함수로 학습
- 전체 탐지 파이프라인이 하나의 모델로 구성됨
→ 모델 전체가 하나의 목적 함수로 최적화되어 학습이 일관됨
4. Anchor Box 기반 예측
- 다양한 크기와 비율의 객체를 탐지하기 위해 Anchor Box 사용
- 데이터셋 특성에 맞게 anchor를 설계하여 성능 향상
→ 박스 예측을 무제한 회귀 문제가 아닌, 기준 박스 보정 문제로 제한하여 일반화 성능을 확보
5. Fully Convolutional Network 구조
- 고정된 입력 크기 기반의 합성곱 연산 중심 구조
- 연산 효율이 높아 실시간 처리에 유리
→ GPU 병렬화에 유리하고, 고정된 연산 그래프로 인해 추론 속도가 빠름