shape (61880, 588)shape (1, 3) 170 (프레임 수) * 14 (세로 패치 수) * 16 (가로 패치 수) = 61880전처리 과정에서 시각적 특징을 합치는(merge) 방식에 대한 정보를 담고 있음특정 영역이나 인접 패치의 정보를 결합하는 전략(예: 두 개씩 merge)으로 해석할 수 있음N*F,D shape의 임베딩 벡터 출력)N*F,D) shape의 임베딩 벡터 출력
Video compressor 을 활용0,10, 1데이터셋을 어떻게 만들 것인가?720 by 1080을, 0.5배 ~ 1배를 랜덤 샘플링하여 input에 넣어줍니다.