대상 DAVIS의 영상중에서
tennis, blackswan, horsejump-high, train 4개에 대해서 측정함
각 영상별 curvature의 각도를 평균냈음
각도가 낮을 수록 부드러움을 의미
| 모델 | tennis | blackswan | horsejump-high | train |
|---|---|---|---|---|
| FinalBoss_v2 | 81.10 | 69.15 | 71.40 | 51.47 |
| ToBo (given checkpoint) | 88.87 | 73.38 | 77.26 | 60.73 |
| DINO | 102.81 | 100.96 | 100.03 | 100.98 |
| DINOv2 | 103.46 | 100.31 | 105.14 | 100.98 |
| random | 98.50 | |||
| crobo | 82.57 | 70.28 | 74.60 | 54.59 |
| crobo2 | 99.3785 |
DINOv2와 DINO는 t-sne 그림상으로도 DAVIS 기준 좋지 않음 ㄷㄷ;;
자자 상황 정리 for 융희
내가 알고 싶은것. 지금 DAVIS 폴더는 어케 만들어진 것인가?
90개의 비디오 클립이 있는데, 각 영상 길이가 다르고, FPS가 같은 것인가? 가령 0.05s 마다 뽑았던가?
이걸 알아야 논문을 쓸 수 있음.
지금 하려는 실험:
(1) qualitative analysis:
(2) quan