shape (61880, 588)
shape (1, 3)
170 (프레임 수) * 14 (세로 패치 수) * 16 (가로 패치 수) = 61880
전처리 과정에서 시각적 특징을 합치는(merge) 방식에 대한 정보를 담고 있음
특정 영역이나 인접 패치의 정보를 결합하는 전략(예: 두 개씩 merge)으로 해석할 수 있음
N*F,D
shape의 임베딩 벡터 출력)N*F,D
) shape의 임베딩 벡터 출력Video compressor
을 활용0,1
0, 1
데이터셋을 어떻게 만들 것인가?
720 by 1080
을, 0.5배 ~ 1배를 랜덤 샘플링하여 input에 넣어줍니다.