08-01) ObjectDetection-1

slow_starter·2025년 9월 1일

스파르타코딩클럽-AI서비스4기

목록 보기

36/44

드디어 8주차 교육이 시작되었다. 병원 진료, 회식, 야근 등으로 몇 번 결석해버린 탓에 수료(80%)하려면 마지막 순간까지 최선을 다해야 할 것 같다.

2-stage(Regional proposal-based) : R-CNN → Fast CNN → Faster R-CNN. Feature map에서 RPN이 후보영역을 제안하고, 그 위에서 분류/박스 보정 수행. 정확도 우수, End-to-End 학습이 가능
1-Stage (Proposal-free): SSD, YOLO. 이미지에 고정 grid와 default/anchor box를 두고 한 번에 분류+박스 회귀(regression). 속도 우수
Anchor(default) box vs Predicted box
- Anchor는 사전에 정의된 기준 박스(비율/크기 고정). 모델은 각 anchor마다 오프셋(중심, 폭/높이)과 클래스 확률(또는 confidence)을 예측해 predicted box를 만든다.

동일 박스에 대한 중복 박스를 제거하는 후처리
1. 특정 클래스에 대해, confidence(혹은 class score)가 높은 순으로 정렬
2. 가장 높은 박스를 선택하고, 그 박스와 IOU가 임계값(예: 0.5) 이상인 박스 제거
3. 남은 박스에 대해 반복
  ※ NMS는 "우세한 최고 점수 박스 하나만 남기고 나머지 중복을 억제"한다

두 박스 A, B의 겹침 정도 $\mathrm{IoU}(A,B) = \frac{|A\cap B|}{|A\cup B|}=\frac{|A\cap B|}{|A|+|B|-|A\cap B|}$
Detection에서 정답 판정은 흔히 $\mathrm{IoU} >= 0.5$ 같은 임계값 사용

\mathrm{Precision} = \frac{TP}{TP+FP}

\mathrm{Recall}= \frac{TP}{TP+FN}

\mathrm{F1}=\frac{2\cdot \mathrm{Precision}\cdot \mathrm{Recall}}{\mathrm{Precision}+\mathrm{Recall}}

PR Curve: detection 결과를 confidence score 내림차순으로 훑으면서 얻는 (Recall, Precision) 쌍의 궤적. 좋은 모델일수록 우상단에 위치
AP (Average Precision): PR 곡선 아래 면적(AUC-PR)
$\mathrm{AP}=\int_{0}^{1}\mathrm{Precision}(r)\,dr$
이산 근사(정렬된 예측에 대해):
$\mathrm{AP}\approx \sum_{k=1}^{N}\big(\mathrm{Recall}_k-\mathrm{Recall}_{k-1}\big)\cdot \mathrm{Precision}_k$
mAP: 클래스별 AP를 평균한 값
$mathrm{mAP}=\frac{1}{C}\sum_{c=1}^{C}\mathrm{AP}_c$
Detection 평가는 보통 IoU 임계값(예: 0.5, 혹은 0.5:0.95 평균)과 PR 기반 AP/mAP을 함께 사용

ROC는 TPR(=Recall)-FPR 축, PR은 Precision-Recall 축.
양성(positive)이 희소한 불균형 문제에서는 PR 곡선이 모델 차이를 더 잘 드러내는 경우가 많다. (Detection은 보통 고불균형.) $\mathrm{TPR}=\frac{TP}{TP+FN},\quad \mathrm{FPR}=\frac{FP}{FP+TN}$

Detection 모델은 anchor 대비 오프셋을 예측한다(예 $t_{x}$ , $t_{y}$ , $t_{w}$ , $t_{h}$ ) $t_x=\frac{x - x_a}{w_a},\quad t_y=\frac{y - y_a}{h_a},\quad t_w=\log\frac{w}{w_a},\quad t_h=\log\frac{h}{h_a}$
여기서 ( $x_{a}$ , $y_{a}$ , $w_{a}$ , $h_{a}$ )는 anchor, $x,w,w,h$ 는 예측 박스. 회귀는 주로 Smooth L1(Huber) 또는 IoU 손실을 이용

2025화이팅!