Open-Clip 래포의 pre-trained weight 사용하기

FSA·2024년 3월 2일

video vision

목록 보기

2/8

>>> import open_clip
>>> open_clip.list_pretrained()

방법 2: https://github.com/mlfoundations/open_clip/blob/main/docs/PRETRAINED.md
- 구체적으로, 어떻게 pretrained-model을 사용할 수 있는지 나와있음.
참고:
- 많은 기존 체크포인트들이 QuickGELU 활성화 함수를 사용
- 이 활성화 함수는 실제로 최근 버전의 PyTorch에서 기본 torch.nn.GELU보다 효율이 떨어짐
- 모델 기본값은 이제 nn.GELU이므로, OpenCLIP pretrained models weight를 사용하기 위해서는, -quickgelu 접미사가 있는 모델 정의를 사용해야 함
- 미래에 훈련된 모델들은 nn.GELU를 사용할 것입니다.

# pretrained also accepts local paths
model, _, preprocess = open_clip.create_model_and_transforms('ViT-B-32', pretrained='laion2b_s34b_b79k')

Full collection of available models on a suite of 38 datasets in a zero-shot setting (i.e., without fine-tuning).
- https://github.com/mlfoundations/open_clip/blob/main/docs/openclip_results.csv
- 위 링크는, downsteream task에 대한 성능도 표로 제공하고 있다.
- 아쉽게도, Video-task에 대한 결과는 나와있지 않다.

모든 의사 결정 과정을 지나칠 정도로 모두 기록하고, 나중에 스스로 피드백 하는 것