# VQA

4개의 포스트
post-thumbnail

[논문리뷰] MDETR - Modulated Detection for End-to-End Multi-Modal Understanding

"MDETR - Modulated Detection for End-to-End Multi-Modal Understanding(2021)"에 관한 리뷰입니다.

2021년 7월 27일
·
0개의 댓글
post-thumbnail

[관련연구]State-of-the-Art model in VQA

※ 본 글은 VQA or 'text to bounding box' 관련 모델들의 연구 및 코드를 간단히 정리했으며, 2020~2021년의 일부 연구의 경우 추가로 성능도 비교하였습니다.

2021년 7월 26일
·
0개의 댓글
post-thumbnail

[관련연구]Object detection using text

※ Text를 이용해 Image 내의 물체를 탐색하는 연구에 관해 정리한 글이다. 즉, Text(문장, 구, 절, 단어 등)과 Image를 input으로 받아 Output으로 Bounding box를 반환해주는 Text-Object-Detection 연구.

2021년 7월 26일
·
0개의 댓글
post-thumbnail

[관련연구]VQA - papers with code

※ 본 글은 Video object segmentation에 선행하는 모델로서 작동하는 VQA 모델을 찾기 위해 사용가능한 github code와 paper를 대략적으로 정리한 글입니다. 작성일 : 2021-05-30

2021년 7월 26일
·
0개의 댓글