moondeokjong.log
로그인
moondeokjong.log
로그인
[AIFFEL] 22.Mar.29, GD_Object_Detection
Deok Jong Moon
·
2022년 3월 29일
팔로우
0
Going Deeper
교육후기
0
오늘의 학습 리스트
슬라이딩 윈도우를 convolutionally 하는 것과 아닌 것의 차이
일반적으로 했을 때는 윈도우 사이즈 하나에 대한 이미지 내 특정 영역을 크롭하고 conv_net에 넣어서 해당 영역에 대한 object가 있을 확률 및 bbox 계산 -> 이것을 슬라이딩 하듯이 여러 영역에 대해 반복
하지만 convolution layer가 비슷하게 한다는 것을 알고 convolution을 통해 중복되는 연산을 병렬적으로 합침
convolution layer로 하면 그냥 conv-net에 통과시키고 마지막 conv layer에서 depth(channel)의 값을 벡터로 해서 여러 receptive field당 확률 및 bbox를 각각의 픽셀에 얻는다고 생각하면 됨
output으로 2 x 2 사이즈를 얻게 된다면...
총 4개의 receptive field에 대해서 탐색했다고 볼 수 있는데
여기서 1개당 bbox 좌표가 주어진다면 어쩌다가 얘네들이 같은 값을 나타내도 사실 원본 이미지에서는 다른 위치들이다.
Non-Max Suppression
진행되는 순서를 정리하자면...
P
c
P_c
P
c
가 낮은 라벨들 삭제(threshold 기준)
IoU가 낮은 라벨들 삭제(threshold 기준)
이 때 IoU 비교는 같은 class에 대응하는 것들끼리 한다.
왜냐하면 bbox에 다른 클래스가 끼어 있을 수도 있으니까
Deok Jong Moon
'어떻게든 자야겠어'라는 저 아이를 닮고 싶습니다
팔로우
이전 포스트
[AIFFEL] 22.Mar.28, GD_Class_Activation_Map_3
다음 포스트
[AIFFEL] 22.Mar.30, GD_Object_Detection_2
0개의 댓글
댓글 작성