moondeokjong.log

moondeokjong.log

[AIFFEL] 22.Mar.29, GD_Object_Detection

Deok Jong Moon·2022년 3월 29일

Going Deeper 교육후기

오늘의 학습 리스트

슬라이딩 윈도우를 convolutionally 하는 것과 아닌 것의 차이
- 일반적으로 했을 때는 윈도우 사이즈 하나에 대한 이미지 내 특정 영역을 크롭하고 conv_net에 넣어서 해당 영역에 대한 object가 있을 확률 및 bbox 계산 -> 이것을 슬라이딩 하듯이 여러 영역에 대해 반복
- 하지만 convolution layer가 비슷하게 한다는 것을 알고 convolution을 통해 중복되는 연산을 병렬적으로 합침
- convolution layer로 하면 그냥 conv-net에 통과시키고 마지막 conv layer에서 depth(channel)의 값을 벡터로 해서 여러 receptive field당 확률 및 bbox를 각각의 픽셀에 얻는다고 생각하면 됨
- output으로 2 x 2 사이즈를 얻게 된다면...
  - 총 4개의 receptive field에 대해서 탐색했다고 볼 수 있는데
  - 여기서 1개당 bbox 좌표가 주어진다면 어쩌다가 얘네들이 같은 값을 나타내도 사실 원본 이미지에서는 다른 위치들이다.
Non-Max Suppression
- 진행되는 순서를 정리하자면...
  1. $P_c$ 가 낮은 라벨들 삭제(threshold 기준)
  2. IoU가 낮은 라벨들 삭제(threshold 기준)
  3. 이 때 IoU 비교는 같은 class에 대응하는 것들끼리 한다.
    - 왜냐하면 bbox에 다른 클래스가 끼어 있을 수도 있으니까

'어떻게든 자야겠어'라는 저 아이를 닮고 싶습니다

이전 포스트

[AIFFEL] 22.Mar.28, GD_Class_Activation_Map_3

다음 포스트

[AIFFEL] 22.Mar.30, GD_Object_Detection_2

0개의 댓글