FSA.log
로그인
FSA.log
로그인
이미지 도메인 task 정리
FSA
·
2024년 3월 1일
팔로우
0
0
딥러닝 기초
목록 보기
29/36
1. image-text retrieval(검색)
텍스트 쿼리를 사용하여 관련 이미지를 검색하거나,
반대로 이미지를 사용하여 관련 텍스트(설명, 태그 등)를 찾는 문제
2. visual question answering (VQA)
주어진 이미지에 대한 자연어 질문을 이해하고, 그 이미지를 분석하여 해당 질문에 적절한 답변을 자동으로 생성하는 문제
3. Image Captioning
주어진 이미지에 대해 정확하고 관련성 있는 텍스트 설명(캡션)을 자동으로 생성하는 문제
FSA
모든 의사 결정 과정을 지나칠 정도로 모두 기록하고, 나중에 스스로 피드백 하는 것
팔로우
이전 포스트
Generative Pre-training / Language Modeling (LM) Loss / PrefixLM
다음 포스트
[CoCa] dual encoder for visual Foundation model
0개의 댓글
댓글 작성