10 seconds
.400/600/700 human action classes
물체와의 상호작용에 중점을 둔 일상 생활 속의 구체적인 동작들을 포함
하는 반면, Kinetics는 더 넓은 범위의 동작과 자연스러운 상황에서의 인간 활동을 다룹니다.SSV2는 창의적이고 다양한 방식으로 특정 동작을 수행하는 비디오에 중점
을 둡니다.SSV2는 사람과 물체 간의 상호작용을 강조
하는 반면, Kinetics는 스포츠, 일상 생활 동작 등 더 광범위한 활동을 포함합니다.15분 길이
)클래스 정의: 복합적인 행동이 아닌, 원자적 시각 행동의 정의
(좀 더 디테일하게 정의했다는 뜻 같음)각 사람에 대해, 여러 class annotations
(하나의 사람도, 여러 class가 배당되어 있다는 뜻 같음)연속된 시간 구간 안에서, 연결된 사람의 행동을 추출할 수 있다.
(클립이 15분 길이이기 때문)평균 30초 길이
)interactions with 46 objects classes
in 15 types of indoor scenes
and containing a vocabulary of 30 verbs
free-text descriptions
(27,847)action labels
, action intervals
classes of interacting objects
temporal locations of all activities
in a video ('Activity Localization').Pass, Drive
2가지 종류 class