Label Assignment Strategy

FSA·2023년 10월 20일
0

Object detection

목록 보기
17/23

개요

  • 객체 탐지 모델은 이미지 내의 여러 개체를 탐지하려고 할 때, 각각의 개체에 대한 바운딩 박스(bounding box)와 해당 개체의 클래스 레이블을 예측합니다.
  • 이때 모델이 예측하는 여러 바운딩 박스 중에서 실제 정답(ground truth) 바운딩 박스와 얼마나 일치하는지를 판단하고 학습을 진행하는데,
    • 이때 어떤 예측 바운딩 박스를 어떤 정답 바운딩 박스와 연관시킬지를 결정하는 전략이 바로 "label assignment strategy"

  • 객체 탐지 모델들, 특히 anchor-based 모델들(https://velog.io/@hsbc/anchor-based-모델)에서는 이 전략이 중요한 역할을 합니다.
  • 예를 들면, Faster R-CNN과 같은 모델들은 여러 개의 anchor box를 사용하여 개체를 탐지합니다.
  • 각 anchor box는 다양한 크기와 비율을 가질 수 있습니다.
    • 학습 동안, 각 anchor box에 가장 일치하는 정답 바운딩 박스를 찾아야 하는데, 이때 사용되는 전략이 label assignment strategy

  • 다양한 label assignment 전략이 있지만, 일반적으로 사용되는 몇 가지 방법은 다음과 같습니다:

IoU(Intersection over Union) 기반 전략

  • 각 예측 바운딩 박스와 정답 바운딩 박스 간의 IoU 값을 계산하고, 특정 임계값(예: 0.5) 이상인 경우 해당 예측 바운딩 박스에 레이블을 할당합니다.

Center Point 기반 전략

  • 예측 바운딩 박스의 중심점이 정답 바운딩 박스 내부에 위치하는 경우 레이블을 할당합니다.

Combined Strategy

  • IoU 값과 중심점 등 여러 지표를 조합하여 최적의 label assignment를 수행합니다.

Dynamic Label Assignment

  • 최근에는 동적으로 레이블을 할당하는 전략도 연구되고 있습니다. 이는 학습 과정에서 동적으로 최적의 레이블 할당 방법을 찾아 나가는 방식입니다.
  • https://velog.io/@hsbc/dynamic-label-assignment

profile
모든 의사 결정 과정을 지나칠 정도로 모두 기록하고, 나중에 스스로 피드백 하는 것

0개의 댓글