이번 Go To Jeju (많은 관심 부탁드립니다🤗) 발표를 준비하면서 Gemini, Gemma, Vertex AI에 대해 한번에 정리해둔 글이 없더라고요. (제가 못찾은걸 수도 있어요..) 그래서 제가 정리해보았습니다!
저도 제가 공부한 것들을 정리한 글이기 때문에 잘못된 내용이 있으면 댓글로 알려주세요!
이 글은 2024년 7월 8일 기준으로 작성되었습니다.
Gemini(제미나이)는 LaMDA 및 PaLM 2의 후속 모델로 구글 딥마인드에서 개발한 LLM입니다.
여기서 LLM이란? Large Language Model로 엄청 많은 파라미터를 보유한 이공 신경망으로 구성되는 언어모델입니다. 예시로 Open AI의 GPT나 Meta의 LLaMA, 구글의 Gemini가 있죠.
2023년 12월 6일 Gemini 1.0을 발표했고, 2024년 2월 16일 Gemini 1.5를 발표하였습니다.
Gemini는 크게 4가지 모델로 분류됩니다.
넷의 차이점은 크게 파라미터의 용량으로 차이가 납니다.
Gemini 중 가장 크고 강력한 모델 Gemini Ultra입니다.
다양한 종류의 창의적인 콘텐츠를 작성하거나 많은 추론이 필요한 문제를 해결하는 등 정말 복잡한 작업을 해결하도록 설계되었습니다.
Gemini의 가장 기본적인 모델입니다. 현재 1.5버전으로 1.0 울트라만큼 강력하고 빠른 모델입니다. 딥마인드에서는 ‘best model’로 표현합니다.
스마트폰에서 외부 서버 없이 실행 가는안 온디바이스 모델입니다. 구글 픽셀8과 갤럭시 S24시리즈에 탑재되어있습니다.
빠른 응답 속도에 초점을 맞춘 모델로 제미나이 1.5 프로를 증류하는 방식으로 개발되었습니다.
제미나이에게 각 모델에 대해서 설명해달라 하니 이렇게 설명해주더군요.


Gemma(젬마)는 구글 딥마인드에서 개발한 오픈 소스 sLLM(smaller Large Language Model)입니다.
Gemini와 큰 차이점은 크게 두가지가 있는데 오픈 소스라는 것과 sLLM이라는 것입니다.
여기서 sLLM이란 smaller Large Language Model로 경량 대규모 언어 모델입니다. LLM과 sLLM의 차이는 파라미터의 크기가 1000억개 이하인 모델을 sLLM으로 분류합니다.
Gemma는 20억개의 파라미터를 가진 Gemma 2B, 70억개의 파리미터를 가진 Gemma 7B로 나뉩니다. 위에서 설명했다시피 LLM에 비해 크기가 작아 온디바이스 모델로 활용이 가능합니다.
Vertex AI(버텍스 에이아이)는 ML 모델과 AI 어플리케이션을 학습 및 배포하고, AI 기반 어플리케이션에서 사용할 LLM을 맞춤 설정할 수 있게 해주는 GCP (Google Cloud Platform)의 서비스입니다.
Gemini는 구글의 LLM
Gemma는 구글의 오픈 소스 sLLM
Vertex AI는 모델을 학습시키고 서빙하기 위한 클라우드 도구