[부스트캠프 AI Tech] 12주차 Warp Up Report

Mattaaa·2022년 4월 8일
0

[부스트 캠프 Pstage-2] - Obejct Detection

Public LB Score 0.7207
Private LB Score 0.7059 (5등)


[나의 목표]

  • 적어도 사용한 모델에 대해서는 알아보자

  • Cascade R-CNN, Centernet2, ATSS, HTC, YOLO 등 최대한 많은 모델 사용 시도

  • Object Detection Task 사용되는 여러 방법론들을 공부하자

  • 대회결과가 전부는 아니지만 상위권에 도전해보자 !


[내가 시도했던 것 들]

공통된 Validation Set 사용

  • EDA 결과 Class Imbalance 문제가 발견되어 Stratified K-Fold 를 사용하여 Set Split
  • 하루 한정된 LB 제출 기회를 효율적으로 사용하기 위해, 팀 내부적으로 평가지표 설정이 필요하였음.
  • Split 된 각 Fold 를 공통된 모델로 학습 후 LB에 제출하여 Validation mAP 와 LB Score 가 가장 유사한 Set 을 내부 평가 지표로써 사용

BackBone 의 변경

MMDetection 의 Baseline 에는 비교적 가벼운 BackBone 들로 Model 이 구현 되어있었다.

따라서 ,이를 Swin Transformer Large 와 같은 무거운 Model 로 변경을 시도해보았다.

그 결과 기존 Model 들의 성능에 비해 비약적인 향상을 이끌어 낼 수 있었다.

Augmentation

이전 Classification Task 에서는 Horizontal Flip 을 제외한 여러가지 Augmentation 을 사용하였을 때, 오히려 결과가 나빠지는 경향이 있었다.

이번 Obejct Detection Task 에서는 우선 데이터를 더욱 증강 시키기 위하여, RandomRotate 와 Vertical Flip 까지 추가해보았다. Rotate 와 Flip 등을 통하여 이미지 형태가 바뀌어도 Detection 결과에 영향은 전혀 가지 않을 것으로 판단 하였기 때문이다.

또한, Train Image 의 밝기가 다양했기 때문에 밝기에 따른 일반화 성능을 끌어올리고자, HueSaturationValue, RandomGamma, CLAHE 를 사용하였다.

마지막으로 초점이 흐린 Image에 대비하여 Blur, GaussianNoise, MotionBlur 를 사용하였다.

해당 Augmenation 을 적용 시킨 결과, 약 0.02 의 mAP 향상을 이끌어 낼 수 있었다.

[Multi-Scale & TTA]

  • Object Detection 대회 상위권 Solution 을 참고한 결과 Multi-Scale Training 이 많았음
    [1024 x 1024] Single Scale → [1024x1024, 512x512, 800x600] Multi Scale 로 변경
    약 0.02 mAP 향상
  • Inference 시, TTA (Horizontal, Vertical Flip) 를 적용.
    약 0.02 mAP 향상

[회고]

  • 단일 모델의 성능도 중요하지만, 결국엔 여러 모델의 Ensemble 가장 중요했었음.

    • 단일 모델 최고 mAP → 0.68
    • mAP 0.6 이상 Model 의 Ensemble → 0.72
  • MMDetection 라이브러리의 사용법과 여러 Object Detection 모델들을 공부하였음.

    • Cascade R-CNN
    • Universenet
    • HTC
    • DyHead
    • Centernet2
  • 최근 나온 논문인 Model Soup 를 적용시켜보지 못한것이 아쉬움.
    → 다른 HyperParameter 로 학습된 동일한 모델의 Weight 를 Ingredient 로 하여금 Average
  • BackBone 의 성능이 대부분의 결과를 좌지우지함.
    → 동일 모델에서 BackBone 에 따라 성능이 매우 차이남.
    Cascade R-CNN with Resnet101 (0.56)
    Cascade R-CNN with Swin L (0.66)

0개의 댓글