miniGPT-4와, MultimodalGPT의 성능을 비교해야하는데, 생성모델은 명확하게 숫자로 성능을 측정하기 어렵다는 걸 알게되었다. 결국 실제로 프롬프트 엔지니어링을 해서 모델을 써봐야 한다는 건데, miniGPT-4 가 웹상으로 보여주는 데모가 작동하지 않고 있는 것 같았다. 그래서 깃헙 레포지토리에 있는 Demo tutorial대로 해보려고 했는데.. 다른 체크포인트나 weight 같은 건 다운받을 수 있는 곳이 링크가 걸려있었지만 'LLaMA weight'은 어디에도 없었다.
이게 뭔지 알아내려고 논문 읽고 있는데, Bard한테 물어보라는 PM분의 조언..!
그랬더니 MetaAI에다가 요청해야된다고 바로 알려주었다. 그래서 구글폼 작성까지 마친 뒤...
찾아보니 원래 연구 목적으로만 사용할 수 있도록 배포했었는데,
LLaMA weight가 이미 유출되서 여기저기 돌아다니는 것 같았다.
아래 블로그의 일부를 참고해서 다운받았다.
-> [LLaMa] M1 Mac에 Meta LLaMa 동작시키기
토렌트 대신 깃헙에서 클론해와서 다운받을 수 있었다. (편-안-)
-> GitHub - shawwn/llama-dl: High-speed download of LLaMA, Facebook's 65B parameter GPT model