perceptual straightening comparision

우병주·2026년 3월 8일

대상 DAVIS의 영상중에서

tennis, blackswan, horsejump-high, train 4개에 대해서 측정함
각 영상별 curvature의 각도를 평균냈음
각도가 낮을 수록 부드러움을 의미

모델tennisblackswanhorsejump-hightrain
FinalBoss_v281.1069.1571.4051.47
ToBo (given checkpoint)88.8773.3877.2660.73
DINO102.81100.96100.03100.98
DINOv2103.46100.31105.14100.98
random98.50
crobo82.5770.2874.6054.59
crobo299.3785

DINOv2와 DINO는 t-sne 그림상으로도 DAVIS 기준 좋지 않음 ㄷㄷ;;


자자 상황 정리 for 융희

내가 알고 싶은것. 지금 DAVIS 폴더는 어케 만들어진 것인가?

90개의 비디오 클립이 있는데, 각 영상 길이가 다르고, FPS가 같은 것인가? 가령 0.05s 마다 뽑았던가?

이걸 알아야 논문을 쓸 수 있음.

지금 하려는 실험:

(1) qualitative analysis:

  • 'Ours' vs 'DINOv2 or DINO' vs 'CropMAE'
  • pca or t-sne

(2) quan

0개의 댓글