OpenAI DevDay 2025 전체 발표 정리

서쿠·2025년 10월 7일

https://x.com/OpenAI/status/1974972945949987096

DevDay Introduction - 개막 인사

샌프란시스코 Fort Mason에서 OpenAI DevDay 2025가 개최되었습니다. Sam Altman CEO는 OpenAI가 시작된 도시이자 AI의 미래를 구축하기로 약속한 샌프란시스코에서 개발자들을 환영했습니다. 2023년 첫 DevDay 이후 거의 2년이 지난 시점에서, 그간의 여정을 돌아보고 새로운 발표를 준비하는 개막 순서였습니다.

https://youtu.be/hS1YqcewH0c

OpenAI Growth - 폭발적인 성장 지표

2023년 첫 DevDay 당시

개발자 수: 200만 명
주간 ChatGPT 사용자: 1억 명
API 토큰 처리량: 분당 3억 개

2025년 현재

개발자 수: 400만 명 (2배 증가)
주간 ChatGPT 사용자: 8억 명 이상 (8배 증가)
API 토큰 처리량: 분당 60억 개 (20배 증가)

이러한 수치들의 변화량은 AI가 "사람들이 가지고 놀던 것"에서 "사람들이 매일 개발하는 도구"로 완전히 전환되었음을 보여줍니다.

Announcement Overview - 오늘의 발표 개요

Sam Altman은 개발자들의 피드백을 철저히 반영한 네 가지 핵심 발표를 예고했습니다:

1. ChatGPT 내 앱 구축

ChatGPT 안에서 앱을 만들 수 있는 방법
대규모 배포(distribution) 지원

2. 에이전트 개발 혁신

에이전트 구축을 더 빠르고 효과적으로

3. 소프트웨어 작성 혁신

반복적인 코딩 작업을 AI가 담당
개발자는 시스템과 창의성에 집중

4. 모델 및 API 업데이트

모든 개발 작업을 뒷받침할 기반 기술

Sam은 "이것은 역사상 빌더가 되기에 최고의 시기"라며, "아이디어에서 제품까지 이렇게 빠른 적이 없었다"고 강조했습니다.

Apps in ChatGPT - ChatGPT 앱 생태계

ChatGPT의 진화 방향

OpenAI는 ChatGPT를 사람들이 더 생산적이고, 더 창의적이며, 더 빠르게 배울 수 있도록 돕는 도구로 만들어왔습니다.

첫 DevDay 이후 지속적으로 개발자에게 ChatGPT를 개방해왔으며:

GPTs 출시: 맞춤형 챗봇 생성 기능
MCP 표준 채택: Model Context Protocol로 다양한 애플리케이션 연결
학습과 실험: 어떤 것은 성공하고 어떤 것은 실패했지만, 많은 것을 배움

새로운 비전: Apps inside ChatGPT

이제 개발자들은 ChatGPT 안에 완전한 앱을 구축할 수 있습니다.
이는 다음과 같은 특징을 가진 차세대 애플리케이션을 가능하게 합니다:

대화형(Interactive): 사용자와 자연스러운 대화 가능
적응형(Adaptive): 컨텍스트에 따라 동적으로 반응
개인화(Personalized): 사용자별 맞춤 경험 제공
채팅 가능(Chattable): 모든 기능이 대화로 제어 가능

Apps SDK Launch - Apps SDK 정식 출시

Apps SDK의 핵심 기능

프리뷰로 제공되는 Apps SDK는 완전한 풀스택 개발을 지원합니다:

https://developers.openai.com/apps-sdk/

1. 백엔드 통합

데이터 연결: 실시간 데이터베이스 및 API 연동
액션 트리거: 외부 서비스 호출 및 트랜잭션 실행
비즈니스 로직: 서버 사이드 처리 완전 제어

2. 프론트엔드 렌더링

완전한 대화형 UI 구현
HTML/CSS/JavaScript 전체 스택 활용
반응형 컴포넌트 설계

3. MCP 기반 아키텍처

Model Context Protocol 표준 기반
백엔드 로직과 프론트엔드 UI에 대한 완전한 제어
오픈 표준으로 누구나 통합 가능

배포 및 도달 범위

Apps SDK로 구축한 앱은:

수억 명의 ChatGPT 사용자에게 즉시 도달
개발자의 제품 확장에 있어 "big deal"이 될 것
기존 제품 구독자는 대화 내에서 바로 로그인 가능

수익화 계획

향후 다양한 수익화 방법 지원 예정:

기존 구독 모델 연동
Agentic Commerce Protocol: ChatGPT 내 즉시 결제 기능
추가 수익화 옵션은 순차적으로 공개 예정

예시

Example - Figma App

Example - Spotify App

Live Demo Start - 실시간 데모 시작

Alexi(ChatGPT 소프트웨어 엔지니어)가 무대에 올라 실제 작동하는 앱들을 직접 시연했습니다.

그는 "이 앱들의 마법은 풍부한 대화형 비주얼과 ChatGPT의 파워를 결합하는 것"이라고 소개했습니다.

Coursera Demo - 교육 앱 통합 사례

첫 번째 사용: 앱 연결

사용자가 아래와 같이 요청하면:

👤 사용자 : "Coursera, teach me something about machine learning"

최초 동의(Consent): 처음 사용 시 Coursera 앱 연결 동의 필요
자동 로그인: 이후부터는 즉시 접근 가능
앱 발견: 사용자가 직접 요청하거나, ChatGPT가 대화 맥락에 따라 자동 제안

인라인 비디오 경험

Coursera 앱은 대화 내에서 인라인으로 표시(채팅 내부에서 동영상 시청 가능)되며:

비디오 재생: 웹에서 렌더링 가능한 모든 콘텐츠 지원
Picture-in-Picture: 비디오가 화면 상단에 고정
동시 대화: 비디오를 보면서 동시에 대화 가능

Talking to Apps: 컨텍스트 인식

가장 혁신적인 기능은 "Talking to Apps"입니다:

👤 사용자: "Can you explain more about what they are saying right now"

Apps SDK는 앱이 현재 사용자가 보고 있는 컨텍스트를 ChatGPT에 노출하는 API를 제공합니다.

이를 통해:

ChatGPT가 비디오의 특정 시점을 정확히 이해
사용자가 별도 설명 없이도 질문 가능
데이터 준비 단계에 대한 설명 등 컨텍스트 기반 답변 제공

이는 ChatGPT를 활용한 학습 경험이 더욱 풍부해지는 사례로, 전 세계 사용자를 위한 새로운 교육 경험을 가능하게 합니다.

Canva Demo - 창작 도구 통합

대화 기반 디자인 워크플로우

사용자가 동생의 반려견 산책 사업을 위한 아이디어를 브레인스토밍하던 중:

원하는 사업체 명(Walk This Wag)으로 포트폴리오 제작을 해보고자 함.

👤 사용자: "Canva, make me a portfolio with this "Walk This Wag" name. I want it to be colorful, whimsical and bright, and ask Coursera for a typing course, prefer sans-serif font."

인라인에서 전체화면으로

Canva가 여러 포스터 옵션을 생성하면:

인라인 뷰: 대화 내에서 여러 디자인 옵션 확인
전체화면 확장: 특정 포스터를 클릭하여 상세 보기
ChatGPT를 통한 수정: "좀 더 밝게", "폰트 변경" 등 자연어로 요청
이미지 생성 경험과 유사: 기존 DALL-E 워크플로우와 일관된 경험

실시간 콘텐츠 변환

👤 사용자: "Canva please make this poster into a pitch deck, we're trying to raise a seed round for dog walking."

몇 초 만에 포스터가 완전한 프레젠테이션 슬라이드 덱으로 변환됩니다.

이는:

마케팅 자료 제작: OpenAI 마케팅 자산 생성
데모 준비: DevDay 발표용 자료
창업 자료: 시드 라운드 피칭 덱

모든 것이 대화 내에서 실시간으로 이뤄집니다.

Zillow Demo - 복합 워크플로우 사례

컨텍스트 연속성

ChatGPT는 이전 대화를 기억 기능을 활용하여, 반려견 산책 사업 위치를 추천함.

새 대화에서도 원하는 답변을 충실하게 답하는 것을 볼 수 있음.

👤 사용자: "Where should we expand?"
🤖 ChatGPT: "Pittsburgh!" (매우 열정적으로 추천)

이제 시연자는 해당 지역의 집을 추천 받고자 합니다.

👤 사용자: "zillow, Show me homes for sale there"

(참고) Zillow는 미국 최대의 온라인 부동산 마켓플레이스로, 집을 사거나, 임대하거나, 판매하는 데 필요한 매물 정보, 데이터, 계산기 등 다양한 도구를 제공하는 웹사이트 및 서비스입니다.

한국의 직방이나 다방과 유사한 플랫폼으로, 미국 부동산 시장의 정보를 통합하고 사용자에게 부동산 거래를 위한 편의성을 제공하는 것을 목표로 합니다.

동적 데이터 로딩

Zillow 앱이 호출되면:
1. 최신 데이터 페칭: 실시간 부동산 정보 가져오기
2. 대화형 지도 임베딩: ChatGPT 내 인터랙티브 맵 표시
3. 매물 목록: 여러 주택이 지도에 표시됨

뷰 전환: 인라인 → 전체화면

인라인 지도가 작아서 보기 어려운 경우:

특정 주택 클릭 → 전체화면 열기
Zillow의 대부분 기능이 ChatGPT에 임베딩됨
투어 요청, 저장, 공유 등 일반적인 Zillow 액션 가능

자연어 필터링

👤 사용자: "Filter this to just the three bedroom homes with a yard"

전체화면 상태에서:

새 인스턴스 생성 없이 기존 앱이 업데이트됨
데이터가 실시간으로 필터링됨
ChatGPT 메시지가 앱 위에 오버레이로 표시

컨텍스트 기반 질문

특정 주택을 확대한 후:

👤 사용자: "How close is this to a dog park?"

Zillow 앱이 현재 사용자가 보고 있는 주택 정보를 ChatGPT에 노출하므로:

ChatGPT는 어떤 주택인지 정확히 인식
Zillow 컨텍스트와 웹 검색 도구를 조합
해당 주택과 가까운 개 공원 정보 제공
다른 도구(예: 대출 계산기) 호출 가능

이는 Apps SDK 경험이 얼마나 동적이고 컨텍스트 인식적인지 보여주는 완벽한 사례입니다.

Launch Partners - 출시 파트너 소개

데모에서 본 앱들과 추가 파트너들이 오늘부터 ChatGPT에서 이용 가능합니다:

확정된 파트너

Booking.com: 여행 및 숙박 예약
Canva: 디자인 및 창작 도구
Coursera: 교육 콘텐츠
Expedia: 여행 플랫폼
Figma: 디자인 협업
Spotify: 음악 플레이리스트
Zillow: 부동산 검색

예정된 파트너 (곧 추가될 예정)

AllTrails: 하이킹·러닝·자전거 등 야외 활동 경로 탐색 플랫폼
DoorDash: 음식 배달 및 로컬 상점 배송 서비스
Khan Academy: 무료 온라인 교육 플랫폼 (수학, 과학, 인문 등)
Instacart: 식료품 장보기 및 배달 서비스
Peloton: 홈 피트니스 및 운동 콘텐츠 제공
OpenTable: 레스토랑 예약 플랫폼
Target: 미국 대형 리테일 유통업체
thefork: 레스토랑 예약 플랫폼 (Tripadvisor 계열)
Tripadvisor: 여행 후기 및 예약 플랫폼
Thumbtack: 지역 기반 전문가·서비스 연결 플랫폼 (예: 수리, 청소, 과외 등)
Uber: 차량 호출 및 배달 서비스

향후 계획

개발자용 Apps SDK

프리뷰로 오늘부터 사용 가능
조기 액세스를 통한 피드백 수집
개발자와 함께 구축

올해 말 출시 예정

개발자가 앱을 제출하여 심사 및 게시 가능
앱 디렉토리 출시: 사용자가 탐색 가능
대화 내 발견 외에도 디렉토리를 통한 탐색 지원

앱 노출 및 추천 기준

Developer Guidelines (오늘 초안 공개):

기본 표준을 충족한 모든 앱은 등록 자격 있음
더 높은 표준을 충족한 앱은 더 돋보이게 표시:
- 디렉토리 내 우선 노출
- 대화 중 추천 앱으로 제안

수익화

곧 더 많은 정보 공개 예정
개발자 피드백을 듣고 싶어함

Sam Altman은 "이것은 개발자와 ChatGPT 사용자 모두에게 흥미진진한 새 장이 될 것"이라며 마무리했습니다.

Building Agents - 에이전트 개발의 현실

AI의 진화: Ask → Do

AI는 "질문하는 시스템"에서 "여러 일을 해주는 시스템"으로 진화하고 있습니다.

이것이 에이전트(Agents)입니다:

에이전트의 정의

컨텍스트(Context): 상황 이해
도구(Tools): 실행 능력
신뢰(Trust): 안전한 자율 실행

이 세 가지를 갖춘 소프트웨어가 작업을 대신 수행합니다.

에이전트 개발의 현실적 어려움

에이전트에 대한 열기는 뜨겁지만, 실제 프로덕션에 배포되는 에이전트는 극소수입니다.

그 이유는 바로:

1. 시작점 불명확

어디서부터 시작해야 할지 모름
어떤 프레임워크를 신뢰해야 할지 불확실

2. 많은 작업량

오케스트레이션: 여러 단계의 워크플로우 조정
평가 루프(Eval loops): 성능 측정 및 개선
도구 연결: 외부 시스템과 통합
UI 구축: 사용자 인터페이스 개발

3. 불확실성

아이디어가 작동할지 알기도 전에 각 레이어가 복잡성을 추가

OpenAI가 본 기회

수천 개 팀과 대화한 결과:

에이전트로 업무 방식을 재구상하려는 엄청난 에너지 존재
기회는 매우 현실적임
OpenAI가 할 일: 에이전트를 더 쉽게 만들 수 있게 하기

AgentKit - 프로덕션 에이전트를 위한 통합 플랫폼

에이전트 개발의 기술적 과제
프로덕션 환경에서 에이전트 배포가 어려운 이유는 다층적 복잡성 때문입니다.

오케스트레이션(orchestration)은 다중 도구 호출 및 의사결정 흐름을 관리해야 합니다.

평가 루프(eval loops)를 통해 에이전트 행동의 정확성과 안정성을 검증해야 합니다.

또한 내부 시스템 및 외부 API와의 안전한 도구 연결(tool connection), 그리고 에이전트와 사용자 간 효과적인 UI 구현까지 고려해야 합니다.

AgentKit Launch - 통합 에이전트 플랫폼

AgentKit는 이러한 각 계층에 대한 솔루션을 제공하는 종합 플랫폼입니다.

AgentKit 소개

아이디어에서 에이전트까지 훨씬 빠르게

AgentKit는 OpenAI 플랫폼에서 제공되는 완전한 빌딩 블록 세트입니다:

설계 목적

에이전트를 프로토타입에서 프로덕션까지 이동
에이전틱 워크플로우를 구축, 배포, 최적화
더 빠르고, 훨씬 적은 마찰로

대상 사용자

개인 개발자부터 대기업까지
모든 사람이 큰 가치를 얻을 것

Agent Builder - 비주얼 워크플로우 설계

Agent Builder의 핵심 개념

빠른 비주얼 방식으로:
- 로직 단계 설계
- 흐름 테스트
- 아이디어 배포
기술적 기반
- 수십만 개발자가 이미 사용 중인 Responses API 기반
- 플랫폼 경험이 있다면 익숙한 기초

노드 기반 아키텍처

왼쪽 패널에서 사용 가능한 공통 빌딩 블록:

1. Agent 노드

LLM 기반 의사결정 단위
각 노드마다 특화된 지시사항 부여 가능

2. Tools 노드

파일 검색
외부 API 호출
데이터베이스 쿼리

3. If/Else 노드

조건부 로직
분류 결과에 따른 라우팅

4. Human-in-the-Loop

중요한 결정에 사람 개입
승인 프로세스 구현

5. Guardrails

안전장치 및 검증
PII(개인 식별 정보) 마스킹, 환각 방지, 콘텐츠 모더레이션

이 패턴들은 OpenAI가 에이전트를 구축하며 학습한 공통 패턴을 추출한 것입니다.

ChatKit - 임베드 가능한 대화 인터페이스

ChatKit의 역할

훌륭한 채팅 경험을 자신의 앱에 바로 가져오기

ChatKit는:

간단하고 임베드 가능한 채팅 인터페이스
자신만의 스타일로 커스터마이징 가능
브랜드 적용 가능
제품 고유의 가치에 집중

에이전트 워크플로우와의 통합

Agent Builder에서 설계한 워크플로우를 ChatKit를 통해 실행하면:

각 에이전트 노드를 거치며 채팅 작동
도구 호출을 포함하여
최적의 응답 형성

이는 복잡한 에이전트 워크플로우를 사용자에게는 하나의 일관된 대화 경험으로 제공합니다.

Evals for Agents - 에이전트 성능 평가

에이전트 평가의 필요성

에이전트를 프로덕션에 배포하기 전, 성능과 안정성을 체계적으로 검증하는 것이 필수적입니다. AgentKit는 에이전트 특화 평가 도구를 제공하여 각 의사결정 단계를 분석하고, 문제점을 조기에 발견하며, 지속적인 개선을 가능하게 합니다.

에이전트 전용 평가 기능

1. Trace Grading (트레이스 등급 평가)

에이전트의 실행 과정 전체를 추적하고 평가하는 기능입니다:

단계별 의사결정 분석: 각 Agent 노드에서 어떤 판단을 내렸는지 상세히 기록
도구 호출 검증: 어떤 도구를 언제, 왜 호출했는지 추적
라우팅 경로 확인: If/Else 노드에서의 분기 결정이 적절했는지 평가
오류 지점 식별: 문제가 발생한 정확한 노드와 시점 파악

예를 들어, 고객 지원 에이전트가 잘못된 답변을 제공했다면, Trace Grading을 통해 어느 노드에서 잘못된 정보를 검색했는지, 또는 어떤 조건 분기가 잘못 작동했는지 정확히 파악할 수 있습니다.

2. Datasets (데이터셋 관리)

노드별 테스트 케이스를 체계적으로 관리하는 기능입니다:

개별 노드 평가: 전체 워크플로우가 아닌 특정 Agent 노드만 독립적으로 테스트
입력-출력 쌍 관리: 각 노드에 대한 예상 입력과 기대 출력을 데이터셋으로 구축
회귀 테스트: 프롬프트나 로직 변경 후 기존 성능이 유지되는지 자동 검증
엣지 케이스 커버리지: 드문 상황이나 예외 케이스에 대한 체계적 테스트

예를 들어, "세션 검색 에이전트"에 대해 100개의 다양한 질문 데이터셋을 준비하고, 프롬프트 수정 전후의 정확도를 비교 측정할 수 있습니다.

3. Automated Prompt Optimization (자동 프롬프트 최적화)

데이터 기반으로 프롬프트를 자동 개선하는 기능입니다:

성능 지표 기반 최적화: 정확도, 응답 시간, 도구 호출 효율성 등을 측정하여 프롬프트 개선
A/B 테스트 자동화: 여러 프롬프트 변형을 동시에 테스트하고 최적 버전 선택
반복 실험 간소화: 수동으로 프롬프트를 조정하는 대신 시스템이 자동으로 실험
베스트 프랙티스 발견: 실제 사용 데이터에서 효과적인 지시사항 패턴 추출

이는 LLM의 비결정적 특성을 고려하여, 통계적으로 유의미한 성능 향상을 달성하는 프롬프트를 찾아냅니다.

4. External Model Evaluation (외부 모델 평가)

벤더 중립적 평가 환경을 제공합니다:

OpenAI Evals 플랫폼 활용: 동일한 평가 인프라 사용
타사 모델 테스트: GPT 외에도 Claude, Gemini 등 다른 LLM 성능 비교
공정한 벤치마크: 동일한 데이터셋과 기준으로 모델 간 객관적 비교
모델 선택 최적화: 비용, 속도, 정확도를 고려한 최적 모델 조합 발견

예를 들어, 간단한 분류 작업에는 저렴한 모델을, 복잡한 추론 작업에는 고성능 모델을 배치하는 전략을 데이터 기반으로 수립할 수 있습니다.

Connector Registry - 안전한 데이터 연결

에이전트를 위한 데이터 액세스

에이전트는 데이터에 접근해야 작동합니다. OpenAI Connector Registry는:

안전한 연결 관리

내부 도구와 에이전트 연결
서드파티 시스템 통합
Admin Control Panel을 통한 중앙 관리

보안 및 제어

모든 것을 안전하게 유지
통제 하에 운영
엔터프라이즈급 권한 관리

실제 구현 사례

Albertsons - 매장 운영 에이전트

Albertsons 소개

미국 전역 2,000개 이상의 식료품 매장 운영
매주 3,700만 명 쇼핑
각 매장은 작은 경제 시스템

매장 관리자의 일상적 의사결정

매장 관리 시에는 끊임없는 결정이 필요합니다:

프로모션 기획
제품 믹스 조정
디스플레이 배치
벤더 관리 등.

AgentKit로 구축한 솔루션

문제 상황 정의:

아이스크림 매출이 예상치 못하게 32% 감소

기존 프로세스:

보고서 작성
스프레드시트 분석
여러 차례 회의
긴 시간 소요

에이전트 활용 프로세스:

직원이 질문: "무슨 일이 일어나고 있나요?"
에이전트가 전체 컨텍스트 분석:
- 계절성(Seasonality)
- 과거 트렌드(Historical trends)
- 외부 요인(External factors)
권장사항 제시:
- 디스플레이 조정 시기
- 지역 광고 실행 제안

결과: 복잡한 의사결정 프로세스가 즉각적인 대화형 권장사항으로 단순화됩니다.

HubSpot - 고객 지원 에이전트

HubSpot과 Breeze

HubSpot: 전 세계 수십만 조직이 사용하는 고객 플랫폼
Breeze: HubSpot의 AI 도구
AgentKit의 Custom Response Widget 활용하여 Breeze 응답 개선

실제 사례: Luma Plants

고객 질문: "애리조나에서 식물이 잘 자라지 않는 이유는?"

Breeze Assistant의 처리 과정:

자체 지식베이스 검색
- 내부 식물 관리 문서 검색
지역별 처리 방법 조회
- 애리조나의 저습도 환경에 적합한 솔루션 찾기
정책 세부사항 통합
- 회사 정책 및 보증 정보 포함
종합 응답 생성
- 여러 정보 소스를 하나로 통합
- 다중 솔루션 제시
- 구체적 권장사항 포함

AgentKit - 활용 파트너 목록

Live Agent Demo - 라이브 에이전트 데모 시작

Christina(Platform Experience 팀)가 무대에 올라 AgentKit가 개발자들이 그 어느 때보다 빠르게 에이전트를 만들도록 돕는 방법을 시연했습니다.

데모 시나리오 설정

기존 DevDay 웹사이트:

모든 참석자가 접근 가능
오늘 일정을 보여주는 정적 페이지
하지만 단순히 정보만 표시

목표:

실제로 사용자를 도와주는 페이지로 만들기
사용자와 가장 관련 있는 세션으로 안내
"우리는 OpenAI입니다. DevDay 사이트에 AI가 있어야 합니다!"

도전 과제

8분 타이머 시작:

AgentKit로 구동되는 에이전트 구축
DevDay 사이트 내부에 배포
모든 것을 라이브로, 청중 앞에서

Christina: "에이전트 구축이 얼마나 어려운지 들었으니, 이것은 도전이 될 것입니다."

무대에 카운트다운 타이머가 표시되며 본격적인 데모가 시작됩니다. ㅎㄷㄷ

Building "Ask Froge" - "Froge에게 물어보기" 에이전트 구축

시작: Workflow Builder

Christina는 OpenAI 플랫폼의 Workflow Builder에서 시작합니다.

코드 대신 비주얼 와이어링:

노드를 시각적으로 연결
복잡한 워크플로우를 쉽고 시각적으로 모델링
에이전트 구축에서 배운 공통 패턴 사용

Phase 1: 메시지 분류기

목표: 들어오는 질문 유형 판별

구조:
1. Classifier Agent 노드 추가

세션 정보 질문인지
DevDay 일반 정보 질문인지 구분

If/Else 노드 추가
- 분류 결과에 따라 행동 라우팅
- 적절한 전문 에이전트로 전달

Phase 2: Session Agent 생성

Session Agent 노드 설정:
1. 이름 지정: "Session Agent"
2. 컨텍스트 부여:
  - "세션 정보 가져오기"에 대한 지시사항
  - 에이전트의 역할 명확히 정의
3. 도구 추가:
  - 세션 정보가 담긴 문서 업로드
  - 파일명: "session"
  - 이 파일에 모든 필요 정보 포함

Phase 3: 커스텀 위젯 생성

목표: 일정을 재미있고 시각적으로 표시

Widget Builder로 이동:

이미 "Froge 101" 클래스용 세션 위젯 디자인 완료
위젯 다운로드
Session Agent에 출력 형식으로 첨부

Preview 확인:

위젯이 제대로 추가되었는지 확인
Session Agent 완성

Phase 4: DevDay Agent 생성

또 다른 Agent 노드 추가:
1. 이름: "DevDay Agent"
2. 컨텍스트 설정:
  - 일반적인 DevDay 정보 제공
  - Froge 스타일로 말하기 - 브랜드 톤 적용
3. 파일 추가:
  - DevDay 전체 정보가 담긴 파일
  - 파일명: "devday"
  - 첨부 완료
4. If/Else 노드에 연결:
  - 일반 정보 질문 시 이 에이전트로 라우팅

Phase 5: Guardrails 추가

가드레일의 중요성:
- 에이전트 구축에서 신뢰는 가장 중요
- 가드레일이 그 확신을 제공
- 다음을 방지:
  - 환각(Hallucinations)
  - 부적절한 콘텐츠
  - PII(개인 식별 정보) 노출

PII Guardrail 설정:
1. 미리 구축된 가드레일 선택
2. Name 포함: 검증을 위해 이름 처리 활성화
3. 워크플로우 시작 부분에 연결
  - Froge가 PII로부터 보호받도록
4. 추가 에이전트 노드로 엣지 케이스 처리
  - Froge 스타일로 말하기 설정
  - 컨텍스트 제거

~~흠 저거 User로 하는거 아니지 않나..?~~

Previewing the Agent - 에이전트 미리보기

출력 구성

최종 사용자에게 표시될 내용 결정:
- 파일 검색 소스 끄기:
  - 내부용이므로 사용자에게 노출 불필요
  - 깔끔한 사용자 경험 제공

Agent Builder에서 미리보기

테스트 질문: "What session should I attend to learn more about building agents?"

에이전트 실행 과정:
1. ✅ 가드레일 체크
2. 🔍 방금 추가한 세션 파일에서 정보 검색
3. 🎨 커스텀 위젯 사용하여 결과 표시
4. ✨ "Orchestrating Agents at Scale" 세션(11:15) 추천
5. 🐸 "Ribbit" 등 Froge 스타일 포함

Publishing the Agent - 에이전트 배포

평가(Evals)에 대한 언급

Christina: "아직 하지 않은 한 가지는 전체 평가(Evals) 세트입니다."

정상적인 프로세스:

플랫폼에서 직접 평가 실행 가능
라이브 배포 전 예상대로 작동하는지 확인

시간상 문제로 이건 SKIP

배포 실행

배포 버튼 클릭:

이름 지정: "Ask Froge"
Publish 클릭
완료: 프로덕션에 완전히 배포된 에이전트!

결과물:

✅ Workflow ID: 직접 실행 가능한 ID 생성됨
📦 프로덕션 환경에 배포됨

코드 vs. 플랫폼 선택

Agent Builder에서 배포하면:

Workflow ID가 자동 생성됨: wf_68e3d4ad25e08190909e417982f295e20d191e9e4
Current version: version="1" (버전 관리도 가능)

그리고 화면에 두 가지 통합 방법이 제시됩니다:

탭 1: ChatKit (No-code 방식)
- "Follow the ChatKit quickstart"
- 위에서 받은 Workflow ID를 복사해서 제품에 임베드
- 간단한 SDK 통합

탭 2: Agents SDK (Code 방식)
- 더 세밀한 제어가 필요할 때
- 직접 코드로 커스터마이징

사이트 통합 시작

1. 세션 생성 함수 구현:

방금 배포한 워크플로우 ID를 사용하여 ChatKit 세션을 생성합니다.

    body: JSON.stringify({
      workflow: { id: "wf_88e3d4aad25e08190909e417982f295e20d191e944312370a" },
      user: deviceId,
    }),
  });

2. ChatKit React 컴포넌트 설정:

시각적 커스터마이징으로 Froge 브랜드 스타일을 적용합니다.

import { ChatKit, useChatKit } from "../lib/chatkit-react";

export const FrogeChat = () => {
  const chatKit = useChatKit({
    api: {
      getClientSecret,
    },
    header: {
      title: {
        text: "Ask Froge",
      },
    ...

3. App 컴포넌트에 통합:

DevDay 웹사이트의 전체 레이아웃을 구성하고, BottomSheet 컴포넌트 안에 FrogeChat을 배치하여 하단에서 슬라이드업되는 채팅 인터페이스를 완성합니다.

export default function App() {
  return (
    <div className="pb-sm px-sm gap-2xl mx-auto flex max-w-[620px] touch-pan-y flex-col overflow-x-hidden overscroll-x-none">
      <AnimatedFroge />
      <LeadLinks />
      <Directory />
      <BottomSheet>
        <FrogeChat /> //여기에 선언!
      </BottomSheet>
    </div>
  );
}

4. 링크 추가:

사이트 상단에 "Ask Froge" 접근 가능한 인터페이스 구성이 완료됩니다.

export default function LeadLinks() {
  return (
    <>
      <Rive src={animationURL} className="mx-auto h-64 w-64" />
      <div className="gap-4xs flex flex-col items-start">
        <a className="text-primary-100" href="https://openai.com">
          Download the entire day <span className="text-[#328FF2]">↓</span>
        </a>
        
          className="text-primary-100"
          href="https://discord.verify.openai.com/devday"
        >
          DevDay 2025 Discord <span className="text-[#54CA31]">↗</span>
        </a>
      </div>
    </>
  );
}

라이브 테스트

사이트 새로고침:

🐸 "Ask Froge" 버튼이 나타남

화면 하단에서 채팅창 올라옴

테스트 질문: "What session should I attend to learn about building agents?"

에이전트 실행 flow:
- ✅ 가드레일 체크
- 🏷️ 메시지 분류
- 📄 파일 검색 도구에서 정보 가져오기
- 🎨 위젯 사용하여 표시
- 💡 "Orchestrating Agents at Scale" 추천
- 🐸 계속 Froge 스타일로 "ribbit" 말하기

The Future of Software - 소프트웨어의 미래

AI가 가져오는 변화

가장 흥미진진한 일 중 하나:

AI로 인해 소프트웨어 작성 방식이 변화하는 새 시대 진입
누구나 아이디어만 있으면:
- 자신을 위한 앱 제작
- 가족을 위한 앱 제작
- 커뮤니티를 위한 앱 제작

(참고) Abundant Software의 의미

기존 시대: Scarcity (희소성)

소프트웨어 개발자는 제한적
만들 수 있는 앱의 수는 한정적
개발 비용과 시간이 많이 듦
결과: 소수의 범용 앱만 존재 (모두가 같은 앱 사용)

AI 시대: Abundance (풍요)

누구나 개발자가 될 수 있음
아이디어만 있으면 즉시 구현 가능
개발 비용과 시간이 극적으로 감소
결과: 무한에 가까운 맞춤형 앱 탄생

실제 사례들

1. 일본의 89세 퇴직자

ChatGPT 도움으로 스스로 코딩 학습
노인 사용자를 위한 11개 iPhone 앱 제작
평생의 지혜를 다른 사람들이 더 독립적으로 살 수 있도록 돕는 도구로 전환

2. 스페인의 Pau Garcia와 Domestic Data Streamers

사람들이 추억과 다시 연결되도록 지원
사용 기술:
- ChatGPT
- 이미지 생성
- Sora (비디오 생성)

3. 애리조나 주립대(ASU) 의대생 🏥

의사로서 해야 할 어려운 인간적 대화 연습 필요
가상 환자 앱 제작
- OpenAI 모델 활용
- 시도하고, 실패하고, 개선 가능
- 실제 진료실 들어가기 전 연습

4. 프랑스 베르사유 궁전 🇫🇷

방문객이 이제 궁전과 대화 가능
Realtime API 사용
예술 및 조각품과 실시간 토론
역사가 대화가 됨

핵심 메시지

Sam: "사람들이 만들고 있는 것을 보는 것은 정말 멋집니다."

이것이 바로 OpenAI가 개발자에게 더 빠르게 구축할 수 있는 더 많은 도구를 제공하는 데 열정적인 이유입니다.

Codex Update - Codex 업데이트

Codex의 진화

올해 초 출시:

Codex의 연구 프리뷰 런칭
OpenAI의 소프트웨어 엔지니어링 에이전트
개발자와 함께 작동하도록 설계
소프트웨어 생성 속도 향상

이후 성장:

Codex는 훨씬 더 유능한 협력자로 성장
코딩하는 모든 곳에서 작동:
- IDE (통합 개발 환경)
- Terminal (터미널)
- GitHub
- Cloud (클라우드)

통합된 경험

ChatGPT 계정으로 모든 것 연결:

작업을 이 도구들 간 원활하게 이동 가능
일관된 워크플로우

새로운 기능들

Sam: "우리는 Codex에 대한 수많은 새 기능을 출시했습니다."

다음 섹션에서 자세히 설명될 예정.

GPT-5-Codex Model - 특화된 코딩 모델

GPT-5-Codex:

Codex에서 실행되는 새 모델
GPT-5의 특별 버전
에이전틱 코딩을 위해 의도적으로 훈련됨

핵심 역량:

코드 리팩토링 (Code Refactoring)
- 대규모 코드베이스 재구조화
- 레거시 코드 현대화
코드 리뷰 (Code Review)
- 심층적인 분석
- 시니어 엔지니어 수준의 피드백
동적 사고 시간 조정
- 작업 복잡도를 동적으로 인식
- 복잡한 작업에는 더 많이 "생각"
- 간단한 작업은 빠르게 처리

개발자 반응

사용자 증가:
- 개발자들이 새 모델을 사랑함
- Codex 사용량 급격히 증가
주요 지표: Daily Messages (일일 메시지 수)
- 개발자가 Codex와 매일 나누는 작업 및 대화 수
- 8월 초 이후: 10배 증가 📈

모델 성장

GPT-5-Codex는 가장 빠르게 성장하는 모델 중 하나:

출시 이후: 40조 토큰 이상 제공
OpenAI 역사상 빠른 채택률

OpenAI 내부 사용

Codex는 내부 빌드 과정 전반에 존재:

모든 신규 코드:
- 오늘날 OpenAI에서 작성되는 거의 모든 신규 코드
- Codex 사용자로부터 나옴
생산성 향상:
- Codex를 사용하는 엔지니어
- 주당 70% 더 많은 Pull Request 완료
코드 리뷰:
- 거의 모든 OpenAI PR이 Codex 리뷰를 거침
- 매우 시니어 엔지니어에게서도 기대하기 어려운 깊이

Codex GA Announcement - Codex 정식 출시

정식 버전 출시

오늘부터:

Codex가 연구 프리뷰에서 벗어남
공식적으로 GA (Generally Available) 🎉

확장: 개인에서 팀으로

기존 상황:

Codex는 이미 개인 개발자들에게 많은 견인력(traction)
하지만 더 많은 것을 할 수 있음

새로운 목표:

엔지니어링 팀에게 Codex를 더욱 유용하게
팀 단위 협업 지원

엔지니어링 팀을 위한 새로운 기능 추가!

Slack Integration 🔔
- 가장 많이 요청된 기능:
  - Slack에서 직접 Codex에게 질문
  - 코드 작성 요청 가능
  - 팀 대화에서 바로 작동
- 사용 사례:
  - 팀원 간 기술 논의 중 즉시 코드 생성
  - 팀 채널에서 직접 문제 해결
  - 비동기 협업 강화
Codex SDK 🛠️
- 팀 워크플로우 확장 및 자동화:
  - Codex를 팀의 고유한 프로세스에 맞게 조정
  - 자동화 파이프라인 구축
  - CI/CD 통합 가능
엔터프라이즈 관리 기능 📊
- 환경 제어 (Environment Controls):
  - 어떤 리소스에 접근 가능한지 관리
  - 보안 정책 적용
- 모니터링 (Monitoring):
  - Codex 사용 패턴 추적
  - 성능 지표 확인
- 분석 대시보드 (Analytics Dashboards):
  - 팀 생산성 측정
  - ROI 계산
  - 사용 트렌드 파악

Codex Adoption Examples - Codex 채택 사례

사용자 범위:

주말 사이드 프로젝트 개발자 👨‍💻
- 개인적인 실험
- 취미 프로젝트
고성장 스타트업 🚀
- Cursor
- Windsurf
- Vercel
- GPT-5로 소프트웨어 작성 및 배포 방식 변화
글로벌 엔터프라이즈 🏢
- 대규모 조직

Cisco 사례

Cisco의 Codex 배포:
- 전체 엔지니어링 조직에 Codex 롤아웃
- 세계적 규모의 기술 기업

성과:

코드 리뷰 속도: 50% 더 빠름 ⚡
- 리뷰 프로세스 대폭 단축
- 병목 현상 해소
프로젝트 타임라인: 수 주 → 수 일 📅
- 평균 프로젝트 기간 극적으로 감소
- 출시 속도 대폭 향상

이는 대규모 조직에서도 Codex가 실질적 영향을 미칠 수 있음을 보여줍니다.

Codex 라이브 데모 - 실시간 소프트웨어 구축

1. 초기 설정 - 컨트롤 패널 구축

사전 작업

Romain은 일찍이 Codex CLI에게 간단한 컨트롤 패널 인터페이스를 만들어달라고 요청했습니다.

요청 내용:

카메라 피드 표시
몇 가지 컨트롤 버튼
빠른 스케치 기반으로 생성

추가 작업:

Figma 브랜딩 추가
디자인에 완벽하게 맞게 렌더링

시작할 기본 인터페이스 준비가 완료되었습니다.

2. 카메라 제어 구현

예상치 못한 질문

Romain은 솔직히 어떻게 시작해야 할지 몰랐다고 고백합니다. 카메라용 C++ SDK가 있다는 것만 알고 있었고, Codex가 아마 JavaScript로 번역하려 할 것이라고 생각했습니다.

1단계: 카메라 제어 방법 문의

How to control a Sony FR7 camera?

2단계: 전체 제어 스택 구축 요청

Please scaffold a VISCA control stack from scratch for a Sony FR7 camera. Create a visca-backend service that speaks VISCA over TCP 52381 using env vars VISCA_HOST and VISCA_PORT, exposes /api/status plus /api/ptz/*, and runs via npm run visca:dev on http://localhost:5000. Add the supporting root scripts, implement frontend server actions and a reusable hook, and wire camera controls. Remember to honor busy/disabled states while calling the camera API.

요청 내용 해설:

Node.js 기반 VISCA 제어 스택 구축
백엔드 서비스: TCP 통신으로 카메라와 연결
API 엔드포인트: 상태 확인 및 PTZ(Pan-Tilt-Zoom) 제어
프론트엔드 연결: 서버 액션과 재사용 가능한 훅
상태 관리: 카메라 busy/disabled 상태 고려

Codex의 놀라운 작업

Romain은 Codex가 데모하기 점점 어려워지고 있다고 말합니다. 왜냐하면 큰 리팩토링 작업에 7시간 이상 연속 작업 가능하고, 제대로 완수하기 때문입니다.

구현 결과

VS Code로 전환하면 Codex CLI가 만든 파일들을 확인할 수 있습니다. Node 서버가 구축되었고, VISCA 프로토콜이 완벽하게 구현되었습니다.

프로토콜 학습의 놀라움:

이 프로토콜을 배우는 데 걸렸을 시간을 상상해보라고 Romain은 말합니다. VISCA 프로토콜은 30년 이상 된 프로토콜로, 매우 특수한 헤더를 전송해야 하며 이 카메라 전용입니다. Codex는 프로토콜을 자동으로 학습하고, 정확한 헤더를 식별하여, 올바르게 구현했습니다.

실제 테스트

카메라 제어 성공:

컨트롤 패널에서 카메라 ON
컨트롤 테스트
인터페이스에서 성공적인 카메라 제어
실시간으로 카메라가 움직임

3. Xbox 컨트롤러 통합

새로운 도전

더 나은 무언가를 할 수 있을 것 같았습니다. Romain은 일찍 백스테이지에서 Xbox 컨트롤러를 발견했고, 시도해볼 만한 것이라고 생각했습니다.

IDE에서 라이브 작업 전송

Wire up a wireless controller to control the camera

Codex의 실시간 작업 과정

화면에 표시되는 것:

1. 계획 수립 (Making a plan):

Codex가 전략을 세움
무엇을 해야 할지 결정

2. 파일 탐색 (Exploring files):

기존 코드베이스 분석
어디에 연결해야 할지 파악

3. 게임패드 연결 방법 파악:

Gamepad API 사용법 이해
카메라 제어와 매핑

Context의 중요성

IDE의 핵심 개념은 Context입니다. 프롬프트가 짧을 수 있는 이유는 Codex가 의도를 이해하고, 최근 사용한 파일을 확인하며, 그에 따라 조정하기 때문입니다. 사용자가 작업 중인 파일, 프로젝트 구조, 관련 종속성을 자동으로 인식합니다.

작업 완료 및 테스트

Task 2는 완료까지 약 1분 소요되며 백그라운드에서 계속 진행됩니다. Xbox 컨트롤러로 카메라를 제어할 수 있는지 테스트한 결과, 작동에 성공했습니다.

Codex의 자율적 판단

정말 멋진 점은 어떤 버튼이 무엇을 해야 하는지 명시하지 않았는데도, Codex가 조이스틱이 좋은 아이디어라는 것을 알아내고 카메라 pan/tilt에 자연스럽게 매핑했다는 것입니다.

4. 조명 시스템 제어 - Cloud Codex 활용

음성 인터페이스 구상

Romain은 흥미로운 인터페이스 중 하나는 음성(voice)이라고 생각했습니다. 시간을 절약하기 위해 Codex에게 Realtime API 통합, Agent SDK 연결, 그리고 화면 하단의 점에 앱 통합을 미리 요청했습니다.

MCP 서버 생성 - Cloud Codex 활용

Romain은 데모에서 더 인상적인 작업을 보여줄 수 있을지 고민하던 중, 주변에 있던 조명 시스템에 주목했습니다. 그는 이 조명을 제어하는 MCP 서버를 직접 만들어보기로 했습니다.

Cloud Codex 프롬프트:

Build a new MCP server for the ENTTEC S-Play lighting system.

Use the S-Play REST API docs from https://github.com/ENTTEC/SplayApi. For instance, it looks like POST <host>/api with `{ command: 8 }` fetches playlists and `{ command: 0, playlist_id }` starts one (controller host provided via SPLAY_HOST).

Implement an Express ESM server that exposes:
 - GET /sse – open an SSEServerTransport session for MCP traffic
 - POST /messages?sessionId= – feed messages back into the active session
 - GET /health – return { name, version, host, playlistCount }

Register MCP tools `enttec_set_target` (host string + optional autoRefresh), `enttec_refresh_playlists`, and one dynamic `enttec_play_id` per cached playlist so that ...

로컬 적용

VS Code로 복귀하여 Cloud Codex에서 작업한 내용을 확인할 수 있습니다. Apply 버튼을 클릭하면 MCP 서버의 모든 변경사항이 로컬에 적용되고, 종속성 설치가 시작되며 준비가 완료됩니다.

5. 음성 제어 데모

통합 테스트

Romain은 본격적인 통합 테스트를 위해 음성 모드를 켜고, Codex가 음성 명령을 인식하여 조명을 정상적으로 제어하는지 시연을 진행하였습니다.

대화 시작

Romain: Hello.

AI: "Hi there, I can hear you loud and clear. Let me know what you need."

카메라 확인

Romain: What do you see on camera?

AI: "I see a large audience in front of you with rows of attendees seated and ready. The room is well lit and the crowd fills the space."

AI가 카메라 피드를 실시간으로 분석하여 상황을 이해하고 설명합니다.

조명 제어 명령

Romain: Could you shine the lights towards the audience?

AI: "I've just lit up the audience with a nice bright light to be perfectly highlighted now."

객석에 조명이 비추며 실시간으로 조명 시스템 제어에 성공했습니다.

청중 인사

Romain: Can you greet everyone here in the room now?

AI: "Hello, amazing developers at Fort Mason! We're so excited to have you here for an incredible day."

조명 상태를 인식하고, 장소 정보(Fort Mason)를 활용하며, 적절한 인사말을 생성하는 다층적 처리가 이루어졌습니다.

정상 복귀

Cool. All right. Let's go back to normal now.

AI가 조명을 정상 상태로 복원합니다.

6. Codex SDK 실시간 리프로그래밍

Romain은 마지막 시연에서 Codex SDK가 가진 진짜 잠재력을 보여주기로 했습니다.
그는 음성으로 Codex에게 요청합니다:

Romain: “Could you ask Codex to show a credits overlay like at the end of a movie but the cast is the attendees?”

곧바로 Codex는 React 앱 내부에서 필요한 컴포넌트를 생성하고, 모든 개발자 참석자 명단을 자동으로 불러와 영화 엔딩 크레딧처럼 화면 상단에 오버레이를 띄우기 시작합니다.

실시간 앱 재프로그래밍

여기서 중요한 포인트는 Codex SDK가 추가된 순간부터 이 앱이 “실시간으로 재프로그래밍(reprogram)” 가능한 상태가 되었다는 것입니다.

Romain이 설명합니다:

“When I sent a task to the voice agent it also added Codex SDK as a tool. That means now, on the fly, I can reprogram this app in real time and adapt it to user needs or any feedback they have.”

즉, Codex SDK는 단순 API 호출이 아니라 앱 내에서 바로 에이전트를 실행·수정할 수 있는 SDK이기 때문에, 이미 실행 중인 React 앱의 코드베이스를 탐색하고 필요한 부분을 패치해 오버레이나 새로운 기능을 추가할 수 있었습니다.

(참고) Codex SDK의 역할 요약

에이전트 임베딩(Agent Embedding): Codex SDK를 앱에 추가하면, 앱 내부에서 Codex 에이전트가 직접 코드베이스를 읽고 수정 가능.

실시간 컨텍스트 파악: 현재 열려 있는 React 컴포넌트와 상태를 파악하여 필요한 기능을 정확히 추가.

동적 툴링(Dynamic Tooling): MCP 서버, REST API, WebSocket, UI 컴포넌트 생성 등 다양한 액션을 에이전트가 실행.

음성 모드 결합: Realtime Voice API와 Codex SDK가 결합해, 음성 명령만으로도 앱을 업데이트하거나 새로운 기능을 시연 가능.

사진 촬영 & 카운트다운

“Great. In the meantime, could you start a countdown and take a photo of all of us?”

Codex는 즉시 카운트다운 UI를 추가하고, 카메라를 제어하여 청중의 사진을 촬영합니다.

조명과 카메라 제어, 그리고 엔딩 크레딧까지—모든 작업이 음성 명령으로 즉석에서 구현되었습니다.

(추가 설명) Romain은 마지막으로 이렇게 강조합니다:
“We took voice, we took devices around us, a sketch, and turned all of this into workable software. All that, without having to write any code by hand.”