Slow pathway: low frame rate, spatial semantics을 capture
Fast pathway: high frame rate, fine temporal resolution에서 motion을 capture한다. lightweight
-> 두 pathway의 output을 합치면 spatial senmantic을 고려하여 object의 temporal change를 인식한다. 위와 같은 방법으로 video recognition
action classification and detection in video
Resnet101을 backbone으로 할 예정
facebook에서 제공하는 pretrained model사용할 예정
reference
https://arxiv.org/pdf/1812.03982.pdf
https://aistudy9314.tistory.com/46