yolo를 써야하는 상황이다.
실행보다 앞서 이론을 보기로 하였다.
yolo 논문 링크 : YOLOv3: An Incremental Improvement
논문 목차대로 리뷰를 하는 것이 이해에 더 도움 될것이라 생각하기에 목차따라 리뷰 진행하였다.
2.1 Bounding Box Prediction
YOLO9000 시스템은 엥커 박스로 차원 군집을 이용해 바운딩 박스를 예측한다. 네트워크는 각 바운딩 박스의 4개의 좌표를 예측한다. 만약 셀이 에 따른 c이미지의 좌측 상단 코너의 오프셋이고 이전 바운딩 박스가 폭과 높이에서 를 가진다면 예측은 다음 수식에 따른다.
그림 2. 치수 사전 및 위치예측이 있는 바운딩 박스입니다. 우린 클러스터 중심으로 부터의 오프셋으로 박스의 폭과 높이를 예측한다. 우리는 시그모이드 함수를 이용해서 필터 적용 위치와 관련된 박스의 중심 좌표를 예측한다. 이 수치는
트레이닝 중 우리는 sum of squared error loss를 사용한다. 만약 몇몇 좌표 예측의 실측값이 t라면 우리 기울기는 실측값 마이너스 예측값이다. 이 실측값은 inverting 되어 쉽게 계산가능 하다. yolo v3 는 각 바운딩 박스에 로지스틱 회귀를 사용하여 객체성 점수를 예측한다. 이 값은 만약 이 전 바운딩 박스가 어떠한 다른 이전 바운딩 박스보다 더 실측값과 겹친다면 1이 되어야한다. 만약 이전 바운딩 박스가 최고는 아니고 그렇지만 실측값 객체 겹친다. 이전 바운딩 박스가 최고는 아니지만 그러나 몇개의 임계값이상으로 실측값과 겹친다면 우리는 그 예측을 무시한다. 우리는 .5 임계값을 사용하고. 우리 시스템과 달리 각 실측 객체 에 대해 하나의 바운딩 박스를 할당한다. 만약 이전 바운딩 박스가 실측객체에 등록되지 아니하였다면 그것은 좌표 나 분류예측에 대해 전혀 손실이 없거나, 단지 객체성만 발생한다.
2.2 분류 예측