시리즈

video summarization

1.video summarization

비디오 요약은 크게 비디오 스토리보드(Video Storyboard)와 비디오 스킴(Video Skim) 종류로 나눠볼 수 있습니다.비디오의 각 구간에서 대표적인 단일 프레임을 추출해 비디오 요약을 구성하는 방식입니다.비디오의 각 구간에서 대표적인 프레임 집합들을 추출

2023년 11월 27일

2.비디오에서, 골 장면 추려내기

action recognition in video 기법을 써서, 골대 안에 공이 있는 장면 추출해내기.공이 골대 안에 있는 데이터 셋을 내가 만들어서, 학습시키기.

2023년 11월 24일

3.Query-Dependent Video Representation for Moment Retrieval and Highlight Detection

video moment retrieval(MR)과 video highlight detection(HD)를 동시에 해결주어진 text query에 대해, 중요도 점수를 측정하는게 목표과거 transformer 기반 연구들은, 주어진 text query와 video con

2023년 11월 28일

4.SlowFast

우리의 모델은 비디오에서 동작 분류 및 탐지 모두에서 강력한 성능을 달성일단 기본적으로, 비디오나 이미지를 컴퓨터가 이해하려면, 그것을 분석하는 방법이 필요해요.이미지의 경우, 우리는 보통 가로(x축)와 세로(y축)를 고려합니다. 비디오의 경우, 여기에 시간(t축)이

2023년 12월 1일

5.CLIP

이 글은 컴퓨터 비전 시스템에 대해 말하고 있어요. 컴퓨터 비전 시스템이란, 컴퓨터가 이미지나 비디오를 보고 그 안에 무엇이 있는지 알아내는 기술을 말해요. 전통적으로, 이런 시스템들은 정해진 범주(예를 들어, 고양이, 개, 차량 같은)의 사물을 인식하도록 훈련되어 있

2023년 12월 1일

6.Goal highlight 학습까지 돌리기

필요성: 오디오는 골이 들어갔는지 아닌지 구분하는데 큰 도움을 준다.가까운 쪽 골대는 그물 소리가 난다.사람들이 골을 넣으면 환호성을 지른다.방법론비디오에서, 오디오 데이터를 어떻게 vector화 추출하는지 파악vector화된 오디오 데이터를, 어떤 pre-train된

2023년 12월 14일

7.QD-DETR 입출력

input: mp4나 MOV 같은 비디오 파일output: mp4 150초짜리 비디오 파일 여러개ClipFeatureExtractor.encode_videoinput: mp4 150초짜리 비디오 파일output: (frame=T, output_dim)ClipFeatur

2023년 12월 15일

8.audio feature extraction

https://github.com/TencentARC/UMT/issues/22https://github.com/TencentARC/UMT/issues/29https://github.com/TencentARC/UMT/issues/18https&

2023년 12월 10일

9.[23, 3][119] QD-DETR

최근, 비디오 이해에 대한 수요가 급격히 증가함에 따라 비디오 순간 검색 및 하이라이트 탐지(MR/HD)가 주목받고 있습니다. MR/HD의 주요 목표는 주어진 텍스트 쿼리에 대해 순간을 지역화하고 클립 별 일치 수준, 즉 중요도 점수를 추정하는 것입니다. 최근의 트랜스

2024년 1월 3일