Public LB Score 0.7207
Private LB Score 0.7059 (5등)
적어도 사용한 모델에 대해서는 알아보자
Cascade R-CNN, Centernet2, ATSS, HTC, YOLO 등 최대한 많은 모델 사용 시도
Object Detection Task 사용되는 여러 방법론들을 공부하자
대회결과가 전부는 아니지만 상위권에 도전해보자 !
- EDA 결과 Class Imbalance 문제가 발견되어 Stratified K-Fold 를 사용하여 Set Split
- 하루 한정된 LB 제출 기회를 효율적으로 사용하기 위해, 팀 내부적으로 평가지표 설정이 필요하였음.
- Split 된 각 Fold 를 공통된 모델로 학습 후 LB에 제출하여 Validation mAP 와 LB Score 가 가장 유사한 Set 을 내부 평가 지표로써 사용
MMDetection 의 Baseline 에는 비교적 가벼운 BackBone 들로 Model 이 구현 되어있었다.
따라서 ,이를 Swin Transformer Large 와 같은 무거운 Model 로 변경을 시도해보았다.
그 결과 기존 Model 들의 성능에 비해 비약적인 향상을 이끌어 낼 수 있었다.
이전 Classification Task 에서는 Horizontal Flip 을 제외한 여러가지 Augmentation 을 사용하였을 때, 오히려 결과가 나빠지는 경향이 있었다.
이번 Obejct Detection Task 에서는 우선 데이터를 더욱 증강 시키기 위하여, RandomRotate 와 Vertical Flip 까지 추가해보았다. Rotate 와 Flip 등을 통하여 이미지 형태가 바뀌어도 Detection 결과에 영향은 전혀 가지 않을 것으로 판단 하였기 때문이다.
또한, Train Image 의 밝기가 다양했기 때문에 밝기에 따른 일반화 성능을 끌어올리고자, HueSaturationValue, RandomGamma, CLAHE 를 사용하였다.
마지막으로 초점이 흐린 Image에 대비하여 Blur, GaussianNoise, MotionBlur 를 사용하였다.
해당 Augmenation 을 적용 시킨 결과, 약 0.02 의 mAP 향상을 이끌어 낼 수 있었다.
- Object Detection 대회 상위권 Solution 을 참고한 결과 Multi-Scale Training 이 많았음
[1024 x 1024] Single Scale → [1024x1024, 512x512, 800x600] Multi Scale 로 변경
약 0.02 mAP 향상
- Inference 시, TTA (Horizontal, Vertical Flip) 를 적용.
약 0.02 mAP 향상
단일 모델의 성능도 중요하지만, 결국엔 여러 모델의 Ensemble 가장 중요했었음.
MMDetection 라이브러리의 사용법과 여러 Object Detection 모델들을 공부하였음.