Make it better
Better는 정확도를 올리기 위한 방법
- Batch Normalization
- High Resolution Classifier
- Convolutional with Anchor boxes
- Dimension Clusters
- Direct location prediction
- Fine-Grained Features
- Multi-Scale Training를 사용
Makes us stronger
stronger는 더 많은 범위의 class를 예측하기 위한 방법
- Hierarchical classification
- Dataset combination with WordTree
- Joint classification and detection를 사용
[Deeplearning] YOLO9000: Better, Faster, Stronger
YOLO v2 는 실제로 YOLO9000: Better, Faster, Stronger이라는 논문 이름으로 발표되었습니다. 9000개의 class를 classification하면서 detection까지 해내는 놀라움을 다시 한번 보여주는데요. 9000개의 클래스를 구성하는 방법까지는 다루지 않겠습니다. 궁금하신 분은 아래 링크를 참고
Center 좌표가 Cell 중심을 너무 벗어나지 못하도록 0 ~ 1 사이의 시그모이드 값으로 조절
논문에는 YOLO V2 Loss에 대한 별도 언급이 없음
• YOLOv1 Loss 와 유사한 Loss식
좀 더 작은 오브젝트를 Detect 하기 위해서 26x26x512 feature map의 특징을 유지한 채 13x13x2048 로 reshape한 뒤 13x13x1024에 추가하여 feature map 생성.
Classification layer가 Convolution layer로 생성하여 동적으로 입력 이미지 크 기 변경 가능 학습 시 10 회 배치 시 마다 입력 이미지 크기를 모델에서 320 부터 608까지 동적으로 변경(32의 배수로 설정)
VGG-16: 30.69 BFLOPS, Top 5 Accuracy: 90%
Yolo v1: 8.52 BFlops , Top 5 Accuracy: 88%
Darknet-19: 19: 5.58 BFLOPS, Top 5 Accuracy: 91.2%
Classification layer에 Fully Connected layer를 제거하고 Conv layer를 적용.
YOLO v2 당시 SSD, R-FCN 등이 이미 발표된 상황이었습니다. 특히 SSD와 YOLO는 같은 single stage 방법을 지향하고 있었기 때문에 경쟁 모델이 되었고, YOLO v2 입장에서는 SSD와의 성능 차이를 부각시키는게 중요한 과제