밀집된 탐지 앵커(densely sampled detection anchors)
사용
특정 시간과 행동 클래스의 쌍
으로 정의됨 (60초 영상이면, 60 * 2hz * 3 class = 360 개
앵커)탐지 신뢰도
만 그렸음)탐지 신뢰도
+ 시간적 변위
가 추론됨'타이트 평균-mAP(tight average-mAP)' 성능 지표에서 상당한 개선 (아래 빨간글씨)
프로세스의 개선:
사전 처리(pre-processing) 및 사후 처리(post-processing) 단계에 작은 변화
다양한 유형의 입력 기능을 '늦은 융합(late fusion)'을 통해 결합
non-maximum suppression, NMS
단계가 적용검증 세트를 사용하여 조정