( 아직 두루미스 에 Table 기능이 추가 안되서 벨로그에 임시로 작성중입니다!! 향후에 모든 포스트는 두루미스로 이전할 계획이에요! )
현재 공개 되어 있는 LLM들중에서 클라우드 형태로 서비스 하는 곳은 크게 2군데.
하나는 ChatGPT로 알려져 있는 OpenAI ( 혹은 Azure OpenAI ). 또 하나는 Google의 Vertex AI - Palm2 & Gemini.
성능 비교는 이 문서의 목적이 아니고, 단순한 가격 비교.
공식 홈페이지에는 각각 1천토큰 / 1천글자당으로 되어 있으나,
소수점이하로 너무 길어서 둘다 1백만토큰/ 1백만글자로 변환 했음.
각각의 괄호안의 k 는 최대 토큰수
** text-bison-32k 와 Gemini Pro의 경우에는 Input + Output 토큰의 합
Model | Input | Output |
---|---|---|
GPT-3.5-Turbo | $1.5 (4k) | $2 (?) |
GPT-3.5-Turbo | $3 (16k) | $4 (?) |
GPT-3.5-Turbo-1106 | $1 (16k) | $2 (?) |
GPT-4-Turbo | $10 (128k) | $30 (?) |
GPT-4 | $30 (8K) | $60 (?) |
GPT-4-32k | $60 (32k) | $120 (?) |
Model | Input | Output |
---|---|---|
text-bison@002 | $0.25 (8k) | $0.5 (2k) |
text-bison-32k | $0.25 (32k**) | $0.5 (8k) |
text-bison,32k (batch ) | $0.2 | $0.4 |
text-unicorn | $2.5 (8k) | $7.5 (1k) |
text-unicorn (batch ) | $2.0 | $6.0 |
Model | Input | Output |
---|---|---|
Gemini Pro 1.0 | $0.125 (32k**) | $0.375 (8k) |
ChatGPT의 과금방식 : 토큰
PaLM2의 과금방식 : 글자수
예)
오늘 날씨는 어떨까? -> GPT : 25토큰 / PaLM2 : 9글자 (9토큰)
What is the weather like today? -> GPT : 7 토큰 / PaLM2 : 26자(7토큰)
토큰 갯수 참고)
ChatGPT: https://platform.openai.com/tokenizer
PaLM2 : https://cloud.google.com/vertex-ai/docs/generative-ai/get-token-count?hl=ko
Ref:
https://platform.openai.com/docs/models/continuous-model-upgrades
https://cloud.google.com/vertex-ai/docs/generative-ai/learn/models
Updated 2024 02 17