Videollama 3 돌려보는 목적과 계획

FSA·2025년 2월 23일
0

[video] foundation model

목록 보기
6/10

1. 얻고자 하는 지식

1.1. video LLM

  • video LLM 코드로 사용하는 법 배우기
  • video LLM 코드 분석하기
  • video LLM을 축구 골 장면에서 fine-tuning 하는 좋은 방법 없는지 생각해보기


1.2. Action recognition

  • video LLM의 pre-trained vision encoder만 가져오기
  • action recognition 코드 작성하기
  • 축구 데이터셋으로 학습 시켜보기



2. 계획표

  • 아래 순서대로, 실천하기

2.1. video LLM

  • video LLM README 쭉 읽어보고, 설치까지 완료하기
  • video LLM 으로, 아래 2가지 비디오에 대해 대화해보고 성능 공유하기
    • 축구 비디오
    • 자율주행 비디오
  • video LLM을 축구 골 장면에서 fine-tuning 하는 좋은 방법 없는지 생각해보기
  • video LLM 코드 분석하기

2.2. Action recognition

  • video LLM의 pre-trained vision encoder만 가져오기
  • action recognition 코드 작성하기
  • 축구 데이터셋으로 학습 시켜보기
profile
모든 의사 결정 과정을 지나칠 정도로 모두 기록하고, 나중에 스스로 피드백 하는 것

0개의 댓글

관련 채용 정보