Object Detection -2-

CuriHuS·2024년 6월 13일
0

AI & Game Programming

목록 보기
7/8
post-thumbnail

Single-stage Detector

한번에 Object Detection을 하게 하면 어떨까?

  • RPN과 비슷함: 그러나, 물체의 여부로서 앵커를 분류하는 것보다 직접 물체 카테고리나 배경을 예측한다.
  • 근데, 문제점: class 불균형 - 배경 앵커가 더 많으면?
  • 해결책: 새로운 loss function 사용(Focal loss)
  • CE(pt)=log(pt)CE(p_t) = -log(p_t)
  • FL(pt)=(1pt)γlog(pt)FL(p_t) = -(1-p_t)^γ log(p_t)

YOLO

Single-stage Detector Model : You Only Look Once

  • Bounding box 좌표와 Class 확률을 Single regression 문제로 재정의 함.





  • 한 셀마다 2개의 Bounding box를 예측한다
    • 즉, 하나의 이미지 당 SS2S*S*2 의 bounding box를 예측하게 됨



  • 일정 비율 이상 겹치는 bbox는 NMS 알고리즘으로 0으로 만들어줌







YOLO의 장점

  1. Reat-time fast
  2. Low background error
  3. Generalization resulting

YOLO의 한계점

  • 하나의 grid cell에 하나의 class 예측, 여러 개의 작은 object가 근접할 때 문제
  • Bbox가 training data를 통해 학습되어 새롭거나 색다른 형태의 bbox를 generalize하기 힘들다(일반적인 비율이 아니라 특별한 비율을 가진 물체 탐지 어려움)
  • 여러 layer(다중 downsampling layer)를 통한 특징들로 bbox를 예측하므로 localization 문제 발생
  • 같은 오차에도 Bbox에 대해 동일한 비율로 손실을 가져 큰 bbox에는 영향이 크게 없지만 작은 bbox에는 영향이 크다.

특징

  • 빠르다: 45fps(빠른 버전은 155fps)
  • Reasons global context: 다른 기술과 달리 이미지 전체를 보기 때문에 문맥정 정보를 encode 함
  • Generalizable representation
  • End-to-end training

Focal Loss

  • 어렵거나 오분류 되는 샘플에 초점을 맞춤
    업로드중..
profile
공부 노트

0개의 댓글

관련 채용 정보