😀 오늘은
Yolov5
의 장점을 논문을 통해 알아보고자 한다. Yolo는 버전이 다양한데 그 중에서도 Yolov5를 많이 사용하는 이유가 있을 것이라고 생각된다. 버전이 높다고 해서 좋은 것은 아니라, 자신의 프로젝트에 맞게 적용할 수 있는 버전을 선택하는 것이 가장 best라고 판단된다.
🔴 Yolov5의 장점
- 원문
2.2. Improvment of YOLOv5s Network Architecture
2.2.1. YOLOv5s Network Architecture
YOLOv5 network [30,31] is the latest product of the YOLO architecture series.
The detection accuracy of this network model is high, and the inference speed is fast, with the fastest detection speed being up of 140 frames per second.
On the other hand, the size of the weight file of YOLOv5 target detection network model is small, which is nearly 90% smaller than YOLOv4, indicating that YOLOv5 model is suitable for deployment to the embedded devices to implement real-time detection.
Therefore, the advantages of YOLOv5 [31] network are its high detection accuracy, lightweight characteristics, and fast detection speed at the same time.
Since the accuracy, real-time performance and lightweight aspect of the fruit detection model are essential to the accuracy and efficiency of the fruit targets recognition for apple picking robot, this study intends to improve the fruit targets recognition network for the apple picking robot based on the YOLOv5 architecture.
The YOLOv5 architecture contains four architectures, specifically named YOLOv5s [31], YOLOv5m [31], YOLOv5l [31] and YOLOv5x [31], respectively.
The main difference among them is that the amount of feature extraction modules and convolution kernel in the specific location of the network is different.
The size of models and the amount of model parameters in the four architectures increase in turn.
Since there were two varieties of targets to be identified in this study, and the recognition model has high requirements for real-time performance and lightweight properties. Therefore, the accuracy, efficiency and size of the recognition model were considered comprehensively in the study, and the improved design of the apple targets recognition network was carried out based on the YOLOv5s [31] architecture (Figure 4).
® Yan, Bin, et al. "A real-time apple targets detection method for picking robot based on improved YOLOv5." Remote Sensing 13.9 (2021): 1619.
🔴 Yolov5의 장점
- 원문에 대한 해석
: Yolov5는 모델 탐지의 정확도가 높고, 초당 최대 140 프레임으로, 연산속도가 매우 빠르다.
: 또한, Yolov5는 모델의 가중치 파일 크기도 Yolov4 보다 작아서 실시간 탐지를 구현하기에 더 적합하다.
:Yolov5 네트워크의 장점
은 (1) high detection accuracy(높은 탐지의 정확도), (2) lightweight characteristics(경량화 특성), (3) fast detection speed at the same time(빠른속도로 탐지)
🔴 Yolov5의 4가지 아키텍처
- YOLOv5s, YOLOv5m, YOLOv5l, YOLOv5x
- 4가지 아키텍처 차이점: 네트워크의 특정 위치에 있는 특징 추출 모듈과 convolution kernel의 양이 다르며, 모델의 크기와 모델 매개변수 양이 차례로 증가한다.
🟠 Yolo의 발전
- 원문
2.1.Development of YOLO Series and YOLOv5
Now the YOLO series includes YOLOv1, YOLOv2, YOLOv3, YOLOv4 and YOLOv5.
YOLOv1 is developed on the basis of R-CNN. It is known that R-CNN (Region Proposals + CNN) uses a convolutional neural network for target detection and, at the same time, add SVM (support vector machine) for prediction classification.
Its position detection and object classification accuracy is very high.
But the computation is heavy, and the detection speed is very slow.
YOLOv1 builds on R-CNN. Input images are processed only once (the origin of YOLO's name), different features are extracted through multiple convolutional layers, and convolution kernel parameters are shared each time. [3] The image detection speed is very fast.
It is faster than the previous detection model and can meet the real-time requirements. It can reach 45 frames per second, using the full image as environmental information. However, the disadvantage is that the position detection accuracy is low and small objects cannot be detected. YOLOv2 improves on YoLov1.
The backbone network is upgraded. YOLOv2 uses average pooling, SoftMax classification and Anchor prediction box. Also, a combined training method of target classification and detection is proposed. Because of these improvements, the accuracy is improved obviously, especially for the detection of small objects, the disadvantage is that the detection accuracy of small objects is not high.
YOLOv3 makes some improvements. The convolutional layer of YOLOv3 is about 2.8 times that of YoLov2, increasing the depth and thickness of the network and thus increasing the model accuracy.
SoftMax classifiers are replaced with multiple Logistic classifiers [4]. YOLOv4 appeared in 2019. The main purpose is to design a fast target detection system that can be applied in a real work environment and can be optimized in parallel.
It uses data enhancement and some of the latest deep learning network tricks in recent years.
Such as CutMix data enhancement, Swish, Mish activation functions [5].
YOLOv5 is the latest product in YOLO series. YOLOv5 is improved on the basis of YOLOv4, and its running speed is greatly improved, with the fastest speed reaching 140 frames per second.
Meanwhile, the size of YOLOv5 is small, and the weight file is nearly 90% smaller than that of YOLOv4, which enables YOLOv5 to be deployed to embedded devices. Compared with YOLOv4, YOLOv5 has a higher accuracy rate and better ability to recognize small objects.
® Liu, Yifan, et al. "Research on the use of YOLOv5 object detection algorithm in mask wearing recognition." World Scientific Research Journal 6.11 (2020): 276-284.
🟠 Yolo의 발전
- 원문에 대한 해석
: YOLO 시리즈는 1~5로 구성되어 있으며, YOLOv1은 R-CNN을 기반으로 개발되었다.
: R-CNN(Region Proposals + CNN)은 타겟 탐지를 위해 컨볼루션 신경망을 사용함과 동시에 예측 분류를 위해 SVM(support vector machine)을 추가하는 것이다.
: R-CNN(Region Proposals + CNN)은 위치 감지 및 물체 분류 정확도가 매우 높지만, 연산량이 많고 검출 속도가 매우 느리다.
: YOLOv1? 입력 이미지는 한 번만 처리되고(YOLO 이름의 유래), 여러 컨볼루션 레이어를 통해 서로 다른 특징을 추출하고 매번 컨볼루션 커널 매개변수를 공유합니다. [3] 이미지 감지 속도가 매우 빠르다. 따라서, 👍 장점은 다음과 같다. (1) 이전 탐지 모델보다 빠르다 (2) 실시간 요구 사항을 충족 할 수 있다. 👎 단점은 (1) 위치 감지 정확도가 낮고 (2)작은 물체를 감지할 수 없다
: YOLOv2? YoLov1 백본 네트워크가 업그레이드된 것으로, 평균 풀링, SoftMax 분류 및 Anchor 예측 상자를 사용한다. 또한 표적 분류와 탐지를 결합한 훈련 방법을 제안한다. 따라서, 👍 장점은 다음과 같다. (1) 정확도 향상 👎 단점은 (1) 작은 물체 감지의 경우, 작은 물체의 감지 정확도가 높지 않다.
: YOLOv3? YOLOv3의 컨볼루션 레이어는 YoLov2의 약 2.8배이며 네트워크의 깊이와 두께를 증가시켜 모델 정확도를 높인다. SoftMax 분류기는 여러 Logistic 분류기로 대체된다[4].
: YOLOv4 (2019년)? 주요 목적은 실제 작업 환경에 적용할 수 있고 병렬로 최적화할 수 있는 빠른 표적 탐지 시스템을 설계하는 것이다.
: YOLOv5? YOLOv5는 YOLOv4를 기반으로 개선되었으며 실행 속도가 크게 향상되어 가장 빠른 속도가 초당 140프레임에 도달한다. YOLOv5의 크기는 작고 가중치 파일은 YOLOv4보다 거의 90% 작아 YOLOv5를 임베디드 장치에 배포할 수 있다. YOLOv4와 비교하여 YOLOv5는 정확도가 더 높고 작은 물체를 인식하는 능력이 더 우수하다.