LLaMA weight 어디서 찾을 수 있는건데...?

선아·2023년 11월 3일

LLaMA weight

miniGPT-4와, MultimodalGPT의 성능을 비교해야하는데, 생성모델은 명확하게 숫자로 성능을 측정하기 어렵다는 걸 알게되었다. 결국 실제로 프롬프트 엔지니어링을 해서 모델을 써봐야 한다는 건데, miniGPT-4 가 웹상으로 보여주는 데모가 작동하지 않고 있는 것 같았다. 그래서 깃헙 레포지토리에 있는 Demo tutorial대로 해보려고 했는데.. 다른 체크포인트나 weight 같은 건 다운받을 수 있는 곳이 링크가 걸려있었지만 'LLaMA weight'은 어디에도 없었다.

이게 뭔지 알아내려고 논문 읽고 있는데, Bard한테 물어보라는 PM분의 조언..!

그랬더니 MetaAI에다가 요청해야된다고 바로 알려주었다. 그래서 구글폼 작성까지 마친 뒤...

찾아보니 원래 연구 목적으로만 사용할 수 있도록 배포했었는데,
LLaMA weight가 이미 유출되서 여기저기 돌아다니는 것 같았다.

아래 블로그의 일부를 참고해서 다운받았다.

-> [LLaMa] M1 Mac에 Meta LLaMa 동작시키기

토렌트 대신 깃헙에서 클론해와서 다운받을 수 있었다. (편-안-)

-> GitHub - shawwn/llama-dl: High-speed download of LLaMA, Facebook's 65B parameter GPT model

선아

Junior ML Engineer

이전 포스트

B2B와 B2C는 어떤 차이가 있을까

다음 포스트

LLaMA weight 어디서 찾을 수 있는건데...?

LLaMA weight

B2B와 B2C는 어떤 차이가 있을까

필요할 때 꺼내쓰는 conda 명령어

0개의 댓글