
https://stibee.com/api/v1.0/emails/share/CfaMKfvaRo9uITS9DHgYmJANiwfpeDU
By. HEATHER
ⓒ 오픈AI
오픈AI가 2년 만에 인공지능 모델인 ‘GPT-5’를 공식 출시했습니다.
GPT-5가 범용인공지능(AGI)으로 가는 중요한 단계라고 강조했는데요.
일부 이용자들은 구버전에 대한 재개방을 요구하는 등 의견이 엇갈리죠.
더 높아진 지능: 샘 올트먼 오픈AI CEO는 "GPT-3는 고등학생, GPT-4는 대학생, GPT-5는 박사급 전문가와 대화하는 느낌"이라고 설명했습니다. 수학·과학·코딩 등 주요 벤치마크에서 최첨단 성능을 보이며, 환각 발생률도 크게 낮췄습니다. 특히 한국어 평가 벤치마크(KMMLU)에서 최고 성적을 기록했는데요. 이는 GPT-4o에서 시작된 한글 처리 기술 개선 덕분이며, 현대 한국어뿐 아니라 문화·역사 지식까지 평가하는 시험에서도 성과를 거뒀죠.
예를 들어 토성의 고리 개수를 묻는 질문에서 GPT-4o는 6.5초, GPT-5는 3.1초 만에 답변을 내놓는데요. 유튜버 ‘미스터후즈더보스’의 테스트에서도 아이폰 출시 모델 수, 포켓몬 타입 조합 개수 등 단순 질의에서 GPT-5는 기존 모델보다 30~55% 빠른 속도를 보였습니다. 복잡한 코딩이나 게임 생성 등 심층 추론이 필요한 작업에서는 시간이 조금 더 소요되지만, 결과물의 질이 향상돼 실용성이 높아졌죠.
안전성이 강화된 뉴 GPT: 또 GPT-5에는 질문에 답할 수 없을 경우 “모른다”고 명확히 말하는 기능이 추가됐습니다. 그동안 AI의 대표적인 문제로 지적된 ‘환각’은 사실이 아닌 내용을 그럴듯하게 제시하는 현상인데요. 이전 GPT-3.5와 GPT-4도 점차 솔직한 답변을 하도록 개선돼 왔지만, GPT-5는 설계 단계부터 사용자를 속이지 않도록 안전성을 강화했습니다.
ありがとう
개발에서 특히 뛰어나: 소프트웨어 개발에서는 더 향상된 기능을 보였는데요. 챗GPT에 “영어 사용자 파트너가 프랑스어를 쉽게 배울 수 있는 웹사이트를 만들고, 교육용 게임도 추가해 달라”라고 요청하자, 곧바로 완성된 사이트를 내놨습니다. 오픈AI는 이 정도 규모의 웹사이트는 실제로 많은 작업이 필요한데, 숙련된 개발자라도 최소 몇 시간, 길게는 그 이상 걸릴 일이라며 GPT-5의 생산성을 강조했죠.
구버전 재개방 요구: 한편, 오픈AI는 GPT-5를 공개한 지 하루 만에 이전 모델 ‘GPT-4o’를 다시 제공하기로 했습니다. 이유는 이용자들의 불만 때문인데요. 이들은 GPT-5의 답변이 일관성이 떨어지고 감정 표현이 부족하다고 지적했습니다. 유료 사용자들은 GPT-5 도입에 따라 챗GPT 메시지 한도 소진 속도가 빨라져 유료 혜택이 줄었다는 주장도 했죠. 이러한 피드백에 따라 오픈AI는 사용자 선택권을 보장하는 쪽으로 방향을 선회했습니다.
통합 기능의 역효과: 일부 이용자는 GPT-5의 추론+일반 기능 통합이 오히려 불편하다고 토로했습니다.
중국 전문가들도 ‘글쎄’: 실제로 중국 AI 전문가들은 GPT-5의 성과에 대해 신중하거나 회의적인 반응을 보이고 있습니다. 상하이 자오퉁대학교 AI학부 장린펑 조교수는 GPT-5가 중국 모델보다 크게 앞서지 않아 연구자나 개발자에게 큰 압박을 주지 않을 것이라고 말했는데요. 특히 ‘사고 기능’ 역시 새로운 개념이 아니라고 지적했는데, 이는 치열해진 LLM 시장에서 우위를 점하기가 쉽지 않음을 보여주죠.