SSD & Yolo

이준호·2024년 11월 20일

인공지능강의

목록 보기
4/9

SSD (Single Shot MultiBox Detector) 모델

  • 한 번의 연산으로 여러 객체를 동시에 탐지
  • 여러 다양한 해상도에서 객체를 탐지
  • 지속적인 영역 예측 (default box)
  • 빠른 속도와 실시간 처리

구조

  1. VGG16과 같은 합성곱 신경망(CNN)을 백본으로 사용
  2. VGG16의 마지막 몇 개의 풀링 레이어에서 생성되는 feature map들은 서로 다른 크기의 객체들을 처리
  3. default box 에 대해 객체 분류, 경계 상자 조정
  4. Non-Maximum Suppression

YOLOv3 (You Only Look Once version 3) 모델

  • Grid-Based Detection
  • 멀티스케일 탐지, 큰 객체는 작은 해상도에서 탐지하고, 작은 객체는 고해상도에서 탐지
  • Bounding Box Prediction
  • 좌표 손실 (Bounding Box 위치), 크기 손실 (Bounding Box 크기), 클래스 확률 손실, 객체 확률 손실 (Objectness Score)

구조

  1. Darknet-53 Backbone: 53개 레이어를 가진 CNN 모델
  2. Detection Head
  • 13x13: 큰 객체.
  • 26x26: 중간 크기 객체.
  • 52x52: 작은 객체.

profile
Business Analyst 희망

0개의 댓글