GPT-4o mini 발표와 충격적인 가격 공개!

Harrison Jung·2024년 7월 19일
5

LLM 그리고 AI

목록 보기
1/8

일어나보니 갑자기 GPT-4o mini 가 공개되었다. 이런거 발표될줄도 몰랐는데,
그런데, 가격이 충격적!

우선 성능이야 아래에서 "대충" 다루고 가격 부터 보자.


(아래에서 한번더 다시 테이블로 정리할 예정 )

gpt4o-mini 의 경우 기존 4o에 비해서 가격이 약 33분의 1로 줄어들었다.
기존에 가장 저렴했던 모델로 평가 받는 구글의 Gemini 1.5 Flash랑 비교해도 훨씬 더 저렴하다.

이게 최고의 "성능"을 이용해야 하는 경우도 있지만 사실 "초대용량" 처리를 해야 하는 경우가 훨씬 많은데, 무조건 "최고로 훌륭한"모델을 사용하기에는 가격부담이 만만치 않단 말이지..
기존에 내가 가격을 비교했던 포스트(Gemini 1.5 Flash 와 GPT-4o 그리고 기타 LLM들의 가격) 에서 내렸던 결론이 - "GPT는 비싸니까 쓰지 말자"..에 가까웠는데, 그걸 뒤집었다.

사실 저번 가격 비교 포스트에서 고성능을 원할경우 현존으로는 최고 성능인 Claude 3.5 Sonnet 이 있고, 저렴한 모델을 원할 경우에는 Gemini 1.5 Flash 라고 평가했었는데, 어쨌던 그게 밤사이 뒤바뀜.

자. 그럼 변경된 가격으로 전체 표를 다시 한번 그려보자.

가격은 1M 토큰당InputOutput
GPT-4o mini$ 0.15$ 0.6
( GPT-4o mini batch )$ 0.075$ 0.3
Gemini 1.5 Flash$ 0.35$ 0.53
( Gemini 1.5 Flash batch )$ 0.175$ 0.265
Claude 3 Haiku$ 0.25$ 1.25

우선 1차로 뽑은 가격은 위와 같다. 실시간으로 데이터를 처리해야 할때의 가격인데, 우선 기존의 Flash와 비교해도 엄청 저렴하다는것을 알 수 있다. Haiku의 경우에는 출력쪽 토큰의 가격이 상당히 높은편. ( 뭐 그래도 다른 대형 모델들과 비교하면야.. )

게다가. GPT 와 Gemini 는 Batch API 라는게 있어서, 일괄로 묶어서 요청을 하면 가격을 절반으로 제공해주는게 있다. 사실상 Haiku와는 가격 비교가 안되는 상황. ( GPT 와 Gemini 만 지원됨 )

우리 서비스는 한달에 수십억 토큰정도는 가볍게 사용하는데, 우리 회사는 GCP 원툴로 알려져 있긴 한데.. 다들 이렇게 가격 경쟁을 하면, 멀티 툴을 고민해 봐야 할듯 ...

Open AI 에서 공개한 성능 지표는 위와 같다. 대충 동일한 보급형 모델중에서는 제일 낫다..라는듯.


Update: 그랬었는데!!! 구글도 가격을 내렸다.
Gemini Flash 가격 기습 인하 - 65% ↓


본격 서비스 홍보 :
기본적으로 두루미스는 AI를 이용해서 블로그 글을 다국어로 번역해주는 서비스라서, 토큰을 어마 어마하게 많이 쓸수밖에 없고, 아무래도 가격에 민감할 수 밖에 없는데, 더구나 최근 생성형 AI 들이 Batch API를 내놓으면서, 실시간이 필요하지 않은것들을 저렴하게 사용할 수 있게 해주는게 좋은듯.

블로그 서비스인데, 왜 velog에 작성하냐고 물어보면... '백링크'용 입니다 ㅎㅎ;

아. 두루미스는 블로그만 있는게 아니라 위키도 있어요.

profile
차세대 생성형 AI 블로그 서비스 "두루미스"를 만들고 있는 개발자

0개의 댓글