[AIFFEL] 22.Mar.29, GD_Object_Detection

Deok Jong Moon·2022년 3월 29일
0
post-thumbnail

오늘의 학습 리스트

  • 슬라이딩 윈도우를 convolutionally 하는 것과 아닌 것의 차이
    • 일반적으로 했을 때는 윈도우 사이즈 하나에 대한 이미지 내 특정 영역을 크롭하고 conv_net에 넣어서 해당 영역에 대한 object가 있을 확률 및 bbox 계산 -> 이것을 슬라이딩 하듯이 여러 영역에 대해 반복
    • 하지만 convolution layer가 비슷하게 한다는 것을 알고 convolution을 통해 중복되는 연산을 병렬적으로 합침
    • convolution layer로 하면 그냥 conv-net에 통과시키고 마지막 conv layer에서 depth(channel)의 값을 벡터로 해서 여러 receptive field당 확률 및 bbox를 각각의 픽셀에 얻는다고 생각하면 됨
    • output으로 2 x 2 사이즈를 얻게 된다면...
      • 총 4개의 receptive field에 대해서 탐색했다고 볼 수 있는데
      • 여기서 1개당 bbox 좌표가 주어진다면 어쩌다가 얘네들이 같은 값을 나타내도 사실 원본 이미지에서는 다른 위치들이다.
  • Non-Max Suppression
    • 진행되는 순서를 정리하자면...
      1. PcP_c가 낮은 라벨들 삭제(threshold 기준)
      2. IoU가 낮은 라벨들 삭제(threshold 기준)
      3. 이 때 IoU 비교는 같은 class에 대응하는 것들끼리 한다.
        • 왜냐하면 bbox에 다른 클래스가 끼어 있을 수도 있으니까
profile
'어떻게든 자야겠어'라는 저 아이를 닮고 싶습니다

0개의 댓글