Computer Vision - Object Detection(4)

나라마야·2023년 7월 30일
0

Computer Vision

목록 보기
6/10

그리드 구성

모델은 YOLO를 기준으로 작성된 겁니다.

하나의 객체 탐지기는 25개의 숫자를 생성합니다.

  • 20개의 클래스 확률.
  • 4개의 경계 상자 구성 요소: 경계 상자 중심의 x, y 좌표 값. 그리고 높이와 길이.
  • 1개의 신뢰 점수.
    하나의 셀에는 5개의 탐지기가 있으니, 결국 5 x 25 = 125의 출력 체널을 가집니다.

위에서 언급한 20개의 클래스 확률에서 가장 높은 값이 곧 그 클래스를 예측한 것이 됩니다.

신뢰도 점수는 0부터 1 사이의 숫자로 모델이 예측한 경계 상자 안에 실제로 객체가 포함되어 있는 가능성을 수치로 표현한 것입니다. 예측한 것이 객체인지 아닌지만 알려줄 뿐 이 객체가 어느 종류인지는 알려주지 않습니다.

셀의 개수는 13x13이고 각 셀에 5개의 탐지기가 있으니 결국 13x13x5 = 845개의 경계 상자를 예측하게 됩니다.

NMS(Non-Maximum Suppression)

하나의 객체에 대해 근처의 셀에서 동일하게 예측할 수도 있고, 또 하나의 셀이 여러 예측을 할 수 있게 되면서 경계 상자가 겹치는 문제가 생깁니다.

이런 경우 "NMS"를 사용해 이런 중복을 제거합니다. 간단하게 NMS는 신뢰도 점수가 가장 높은 경계 상자는 유지하고 이 경계 상자와 겹치는 다른 상자를 제거합니다. 이때 겹치는 정도를 임계값을 기준으로 정합니다.

profile
언제나 나 자신에게 되물어 보기. So What?

1개의 댓글

comment-user-thumbnail
2023년 7월 30일

정보 감사합니다.

답글 달기