8주차 수업도 바쁘게 흘러가고 있다. 새로운 회사에서도 3개월차가 되었다. 이렇게 삶이 하루씩 흘러가는 것이지 싶다.
01. 얼굴 검출 개요: Haar → SSD → YOLO
Haar Cascade: 사전 정의된 사각 특징(haar-like features)을 슬라이딩 윈도우 + cascade로 평가. 간단 특징 → 복잡 특징으로 단계적 거름, 학습은 AdaBoost로 약분류기 가중 결합. 실제 구현은 적분영상(integral image)로 특징 합을 O(1) 계산
SSD (Single Shot MultiBox Detector): 단일 네트워크(1-stage)에서 여러 스케일의 feature map(예: 38×38, 19×19, 10×10, 5×5, 3×3, 1×1)을 동시에 사용하여 다양한 크기의 물체/얼굴을 탐지. 각 셀마다 여러 default boxes(=anchor 유사)를 두고 오프셋 + 클래스를 예측
YOLO 계열: 이미지 전체를 격자 단위로 한 번에 예측(속도 강점). SSD는 다중 스케일 특징을 활용해 속도와 정확도 균형을 강화
02. SSD 아키텍처 핵심
Backbone: VGG16 등 분류기에서 fc를 conv로 대체하여 검출기에 적합화
멀티스케일 특징맵(예시 입력 300×300일 때):
38×38, 19×19, 10×10, 5×5, 3×3, 1×1에서 모두 예측 헤드 적용
예측 방식: 각 셀마다 k개의 default box에 대해 (4+C) 채널(= 4개 bbox 오프셋 + C개 클래스 점수) 출력. 전체 박스 수(SSD300 기준)는 8732