[2023 하계 모각코] 팀 "원래는 종경이가 팀장이었다" 4회차 - 계획 및 결과

정주헌·2023년 7월 31일

23년 하계 모각코 개인 리뷰

목록 보기

5/7

AI공동경진대회 준비 및 VIS(Video Instance Segmentation) 관련 논문을 읽어보자.

Python

4회차: 7/29 13:00 ~ 16:00

등장 배경
앞선 선행 연구들은 Online, Offline 다양한 방식으로 VIS Task를 수행해왔다.
Online : Offline 모델에 비해 성능이 떨어짐, frame 혹은 clip 간 matching association method가 필요
Offline : 모델에 적용할 수 있는 Video 크기가 제한적임.
따라서 본 논문에서는 일반적인 환경에서 Video input의 크기 제한을 덜 받는 모델을 제안한다.
핵심 기술
- dense feature map 대신 Object token(query) 사용
- frame level detector인 mask2former 사용
- Similarity loss 사용
모델 구조
결과
- Datasets : YouTube-VIS 2019, 2021 OVIS![]