네이버 AI 부스트캠프 4기 : P-stage Object Detection 4

nask·2022년 11월 27일

네이버 AI 부스트캠프 4기

Object Det 6강 : 1 stage Detectors

1. Scaling up in CNN

모델의 성능을 향상시키기 위해서는 주로 width/depth/image resolution을 키움

Width Wcaling으로는 WRN(Wide Residual Network) 등이 있음
주로 작은 모델에서 사용되며, 미세한 특징을 잘 잡아내면서 학습도 쉬움
but, 너무 얕은 모델의 경우 high-level 특징 포착이 어려움

Depth Scaling으로는 ResNet 등이 있음
많은 ConvNet에서 쓰이며 복잡한 특징들을 잘 잡아내고 일반화 성능이 우수
but, gradient vanishing 문제 발생해 학습이 어려움

Resoulution Scaling은 고화질의 input 이미지를 사용해 미세한 패턴 포착에 용이

2.EfficientNet

모델들의 파라미터 수가 점점 많아짐에 따라 정확도는 올라가지만 연산 속도는 느려지는 상황
model scaling으로 모델의 정확도와 효율성을 모두 달성하려 함
실험 결과, 네트워크의 폭/깊이/해상도를 키우면 정확도가 향상되지만, 그 정도는 점차 감소함
또한, 더 나은 정확도와 효율성을 위해 세 가지 scale 요소의 균형을 잘 맞춰줘야 함

다양한 실험 결과 최적의 scale factor 찾음

3. EfficientDet

Object Detection task는 자율주행차량이나 실시간 위험 감지 등에 쓰이기 때문에 특히나 속도가 중요함
1 stage model이나 anchor free model의 경우 속도는 빠르지만 정확도가 낮다는 문제가 있음

3-1. Efficient multi-scale feature fusion

업로드중..

업로드중..

multi-scale feature fusion을 위해 기존의 Neck과 달리 단순합이 아니라 학습가능한 웨이트를 두는 Weighted Feature Fusion을 사용하는 BiFPN(bi-directional feature pyramid network) 제안
하나의 간선을 가진 노드는 제거하고, output 노드에 input 노드 간선을 추가함
하나의 block을 feature layer로 취급하여 반복적으로 사용

3-2. Model Scaling

EfficientNet과 같은 compound scaling 방식을 제안
EfficientNet B0 ~ B6을 backbone으로 사용

이전 포스트

논문리뷰 : Weighted boxes fusion: Ensembling boxes from different object detection models

다음 포스트

네이버 AI 부스트캠프 4기 : P-stage Object Detection 5

0개의 댓글