Gemini 2.5 Flash 등장

.·2025년 4월 20일
0

AI

목록 보기
1/6
post-thumbnail

매우 최근인 4월 17일에 Gemeni 2.5 Flash가 혜성처럼 등장하였다.

여러 뉴스와 개발 커뮤니티에서 Gemini 2.5에 대한 내용들이 많길래 궁금해서 찾아보게 되었다.

Gemini가 먼데?

Gemini는 무려 구글의 대형 언어 모델(LLM)인 LaMDA와 PaLM, Gemini를 기반으로 하는 인공지능 검색 엔진 서비스라고 한다.
2023년 3월 경 미국과 영국 대상으로 영어 버전으로 베타 테스트를 시작했고, 2023년 7월 13일부터는 46개의 언어로 이용이 가능하다고 한다.

그렇다면 이번 Gemini 2.5 등장한게 얼마나 좋은걸까?

Gemeni 2.5 Flash는 뛰어난 고급 추론 능력과 멀티모달 처리 기능을 갖추고 있으며, 비용 효율성과 속도 면에서 큰 개선을 이뤘다고 평가받는다.

특히 2025년 4월 17일, 구글 개발자 블로그에서 공식 발표된 "Start building with Gemini 2.5 Flash" 내용에 따르면 이 모델은 단순히 "빠른 응답"이 아닌 "똑똑한 빠름", 즉 지능형 속도와 효율성의 조합을 보여준다!

Gemini 2.5 특징들

Gemeni 2.5 특징들은 다음과 같이 5개 단계로 나뉜다.

1. 하이브리드 추론 (Hybrid Reasoning)

Gemini 2.5는 단순 질의응답부터 복잡한 분석까지, 필요에 따라 추론 깊이를 조절할 수 있는 유연한 연산 방식을 탑재했다.


구글 공식 블로그에 나온 사진을 살펴보면,
"Thinkng budget"을 높일수록 모델이 더 깊게 사고할 수 있게 되어 성능이 향상되는 모습을 볼 수 있다.
좌측의 과학적 질문 같은 경우에는 Thinking Budget이 증가할수록 정확도(Performance %)가 74% → 81%로 향상되는 모습을,
우측의 코드 생성같은 경우 Thinking Budget이 증가하면서 성능이 약 41% → 65% 이상으로 향상되는 모습을 살펴볼 수 있다.

2. 100만 토큰 컨텍스트 지원

Gemini 2.5 Flash는 최대 1,000,000 토큰 context window를 지원한다. (스트리밍 입력 기반)
즉, 논문 수십 편도 충분히 학습이 가능하다.

3. 완전한 멀티모달 (텍스트, 이미지, 오디오, 영상까지)

Gemini 2.5 Flash는 텍스트 입력은 물론, 이미지, 오디오, 영상 처리 모두 가능하다.
즉, 멀티모달 reasoning이 가능한 구조로 설계되어있다.

4. 엄청난 비용 효율성

다음과 같이 다른 AI들과 비교해봤을 때 엄청난 비용의 효율성을 느낄 수 있다.

5. 최대 출력 토큰 수 증가 (→ 65,536 토큰)

기존 대부분의 LLM은 출력 한도가 8K~32K 토큰 수준에서 제한되었지만,
Gemini 2.5 Flash는 최대 65,536 토큰까지 한 번에 생성 가능하다.

이는 책 한 권 분량(약 300~400 페이지에 해당하는 토큰 수)을
끊김 없이 한 번에 출력할 수 있는 수준으로, 장문 요약, 보고서 생성, 코드 베이스 출력 등에 매우 유리하다는 장점이 있다!

다른 모델들과 성능이 어떻게 다를까?

아래는 수학, 코딩, 추론, 이미지 인식, 다국어 처리 등 다양한 기준으로 비교한 벤치마크 결과다.

여러 LLM을 대상으로 과학(GPQA), 수학(AIME), 코드 생성, 시각 추론(MMMU), 이미지 이해, 언어 성능(Global MMLU 등)을 정리한 표다.

최근에 또 나왔던 OpenAI o4-mini와 비교해보면 가격 면에서는 대략 7배 정도 싸고, 성능은 경우에 따라 달라지는 모습을 보인다.

대표적으로 Gemini 2.5장문 응답(MRCR), 다국어(Global MMLU), 이미지 이해(Vibe-Eval), LiveCodeBench(코드 생성) 부분을 앞서고 있다.
(<-> OpenAI o4-mini수학과 코드 편집, 과학, 시각 추론 부분에서 우위를 점하는 모습을 보인다.)

정리하면,
Gemini 2.5 Flash는 멀티모달, 장문, 다국어, 비용 효율성에서 훨씬 뛰어나고,
OpenAI o4-mini는 수학, 논리, 편집 등 정확성 기반의 핵심 기능 성능에서 뛰어나다고 볼 수 있다.

그래서 성능이 조금 밀려도 비용이 많이 싸고, 다양한 작업이 가능한 모델이 필요하다면, Gemini 2.5 Flash를 사용해도 될 것 같다!

그럼 써? 말아


그럼 써? 말아 라는 질문에 대해서는

Gemini 2.5가 나같은 학생 입장에서 OpenAI보다는 좀 부담되지 않게 쓰기에는 좋은 것 같다. 7배 차이 나는데도 몇 가지 부분이 심지어 성능을 앞서고 있으니..

하지만 개발하고, AI를 공부하고 있는 입장에서 o4-mini를 발 담궈본 사람은 알듯이 수학과 추론 부분이 많이 뛰어난 OpenAI를 계속 쓸 것 같다... (신세를 많이 지고 있다.)

그래서 아무래도 개발, AI쪽 관련해서는 수학과 코드 편집 기능이 뛰어난 OpenAI o4-mini를, 다방면으로 알차게 그리고 가격대가 부담되지 않는 선에서 AI를 쓰고 싶다 하면, Gemini 2.5를 쓰면 좋을 것 같다!

각자가 가지고 있는 목적에 맞게 쓰면 될 것 같다.

추가적으로)
https://www.youtube.com/watch?v=zlAtQZ23ZMo
챗지피티 o4와 Gemini를 비교하면 어떻게 되는지 실제로 테스트 하는 영상이여서 한 번 보면 좋을 것 같다!

0개의 댓글