머신러닝에서는 물체인식(Object Detection)은 특정이미지에서 테두리 상자(Bounding Box)를 통해 영역을 설정하고 해당 영역 내 물체의 존재 유무 또는 물체의 종류를 판별 하는 것.
정확도뿐만 아니라 신속성이 중요해지고 있는 추세.
기존 RCNN계열의 모델들은 일정 수준의 정확성은 있으나, 실제 적용하기에 신속성이 떨어짐.
You Only Look Once의 약자로써, 이미지를 한 번 보는 것으로 object의 종류와 위치를 추측.
단일 네트워크를 통해 여러개의 테두리 상자(Bounding Box)에 대한 객체 확률 계산.
물체인식(Object Detection)을 수행하기 위해 고안된 심층 신경망으로서,
테두리상자 조정(Bounding Box Coordinate)과 분류(Classification)를 동일 신경망 구조를 통해
동시에 실행하는 통합인식(Unified Detection)을 구현하는 것이 가장 큰 특징.
a. 이미지를 S*S개의 grid cell로 분할.
b. 각 cell마다 하나의 객체 예측.
c. Bounding Box를 통해 객체 위치 및 크기를 파악.