진짜 'Open'AI, 이제는 이름값 한다

Softmax남용자·2025년 8월 6일
post-thumbnail

OpenAI가 오랜 침묵을 깨고 드디어 '진짜 오픈' 모델을 내놓았다.
이름하여 gpt-oss-120bgpt-oss-20b.
단순한 릴리즈가 아니라, AI 생태계 전체의 흐름에 의미 있는 전환점을 제시하는 시도다.


오픈 웨이트 모델의 의미

'오픈 웨이트'란, 모델의 파라미터(=웨이트)를 누구나 열람하고 활용할 수 있도록 공개한 것을 뜻한다.
이는 학계, 기업, 개인 개발자 모두가 모델을 직접 호스팅하고 커스터마이징할 수 있는 기반이 된다.
이번 gpt-oss 시리즈는 OpenAI가 GPT-2 이후 처음 공개한 오픈 웨이트 언어 모델이다.

데이터셋은 여전히 비공개이지만, 모델 아키텍처와 가중치를 전면 공개한 점에서 그간의 폐쇄적 기조를 넘은 진일보다.


왜 중요한가

  1. 현실적 성능
    gpt-oss-120b는 OpenAI의 o4-mini에 필적하는 추론 성능을 보여준다.
    gpt-oss-20b는 o3-mini 수준의 퍼포먼스를 단 16GB GPU에서도 가능하게 만든다.

  2. 낮은 진입 장벽
    대형 모델임에도 단일 GPU, 에지 디바이스에서 돌아간다.
    이는 개인 개발자나 소규모 기업도 부담 없이 자체 AI 시스템을 구축할 수 있음을 뜻한다.

  3. 도구 사용 능력 내장
    퓨-샷 함수 호출, CoT 추론, 구조화된 출력 등 에이전트 워크플로에 최적화된 기능이 기본 제공된다.
    단순 텍스트 생성기를 넘어, 실제 문제 해결에 유의미한 도구가 될 수 있다는 점이 중요하다.


기술적 특징 한눈에 보기

모델명총 파라미터활성 파라미터GPU 메모리 요구컨텍스트 길이experts 개수
gpt-oss-120b1170억51억80GB128k128
gpt-oss-20b210억36억16GB128k32
  • Mixture-of-Experts 아키텍처(MoE)로 추론 효율성 확보
  • RoPE 포지셔널 인코딩으로 128k 토큰 초장문 대응
  • reasoning_effort 파라미터로 추론 난이도 조절 가능

생각해볼 부분

이번 오픈 모델은 단순한 기술 릴리즈가 아니다.
GPT-4o 수준의 상업 모델이 난립하는 지금, 오픈AI가 오픈 웨이트로 회귀한 것은 AI 생태계에 균형을 맞추기 위한 헌신이라 해도 과언이 아니다.

기술력은 상용 모델에 가깝고, 활용성은 더 넓으며, 접근성은 비교 불가능하게 낮다.
이는 모든 개발자에게 독립적인 AI 실험 공간을 제공한다는 점에서 큰 의미가 있다.


끝으로

AI 개발은 더 이상 거대 클라우드 사업자나 빅테크만의 영역이 아니다.
gpt-oss 시리즈는 "나도 만들 수 있다"는 가능성을 현실로 바꿔준다.
진짜 'Open'AI의 등장은 AI 개발의 민주화로 가는 출발점이지 않을까?


🔗 참고 링크

profile
model.eval()은 까먹어도, logits에 Softmax는 두 번 씌운다.

0개의 댓글