-
anchor box를 사용할 때 box의 (x, y)를 예측하는 부분에서 모델의 불안정성이 있었다
-
GT 값과 초반에 예측한 (x,y)값이 크면 loss가 커지게 되고 loss가 크면 학습이 잘 되지 않는 문제가 있다
-
아래의 두 식을 적용하여 해당 문제를 해결하였다
- x=(tx∗wa)−xa
- y=(ty∗ha)−ya
- t : networt 예측 값
- (x, y) : grid의 center 좌표
- 따라서 gird center에 맞게 값을 normalization 해주는 과정
-
각각의 cell에서 5개의 bbox를 예측
-
bbox는 5개의 coordinate를 가지고 있다
- tx,ty,tw,th,to(object 확률값)
-
최종 예측값
- bx=σ(tx)+cx
- by=σ(ty)+cy
- bw=pwetw
- bh=pheth
- Pr(object)∗IOU(b,object)=σ(to)
- 여기서 pw,ph는 anchor의 w, h
-
5%의 성능 향상