FSA.log
로그인
FSA.log
로그인
Videollama 3 돌려보는 목적과 계획
FSA
·
2025년 2월 23일
팔로우
0
0
[video] foundation model
목록 보기
6/10
1. 얻고자 하는 지식
1.1. video LLM
video LLM 코드로 사용하는 법 배우기
video LLM 코드 분석하기
video LLM을 축구 골 장면에서 fine-tuning 하는 좋은 방법 없는지 생각해보기
1.2. Action recognition
video LLM의 pre-trained vision encoder만 가져오기
action recognition 코드 작성하기
축구 데이터셋으로 학습 시켜보기
2. 계획표
아래 순서대로, 실천하기
2.1. video LLM
video LLM README 쭉 읽어보고, 설치까지 완료하기
video LLM 으로, 아래 2가지 비디오에 대해 대화해보고 성능 공유하기
축구 비디오
자율주행 비디오
video LLM을 축구 골 장면에서 fine-tuning 하는 좋은 방법 없는지 생각해보기
video LLM 코드 분석하기
2.2. Action recognition
video LLM의 pre-trained vision encoder만 가져오기
action recognition 코드 작성하기
축구 데이터셋으로 학습 시켜보기
FSA
모든 의사 결정 과정을 지나칠 정도로 모두 기록하고, 나중에 스스로 피드백 하는 것
팔로우
다음 포스트
VideoLLaMA 3 README
0개의 댓글
댓글 작성
관련 채용 정보