OpenAI 开发者日发布了震撼消息,其开发者数量已达惊人的400万,ChatGPT周活跃用户达到8亿,每分钟API处理的token量高达60亿。
本次大会主要聚焦于以下四个方面:
- 在 ChatGPT 内部构建应用:Apps inside ChatGPT,OpenAI推出自己的Apps SDK。这被视为一项革命性进展,OpenAI旨在将ChatGPT转变为一个操作系统,颠覆现有应用生态。
- 直接拖拽构建Agent工具:AgentKit。发布了8分钟拖拽演示视频,展示了该工具的直观性。
- Codex更新,最新能力演示视频已发布。
- API支持:Sora 2,GPT-5 Pro。

Apps in ChatGPT:开启一个全新的应用分发与互动生态
此次发布被认为是OpenAI最具震撼性的战略举措,标志着ChatGPT正式进军操作系统领域。OpenAI的愿景是让ChatGPT成为用户唯一所需的超级应用,从而在实质上扮演操作系统的角色,这无疑给现有应用商店带来了巨大挑战。
过去,OpenAI通过GPTs和MCP等方式尝试连接开发者服务与ChatGPT,积累了宝贵经验。如今,OpenAI迈出决定性一步,正式向开发者开放ChatGPT,允许其在其中构建原生应用(Apps)。
这将催生新一代应用形态,具备互动性(interactive)、适应性(adaptive)和个性化(personalized)三大核心特质。用户将不再只是与聊天机器人对话,而是能直接在对话中与功能丰富的应用进行交互。为实现此目标,OpenAI推出了全新的Apps SDK(软件开发工具包),现已开放预览。
Apps SDK为开发者提供了一套完整的全栈解决方案,其主要特性包括:
- 连接数据:开发者可无缝接入自己的数据源和后端服务。
- 触发动作:应用能执行具体的后端操作,例如创建设计、预订行程或分析数据。
- 渲染完整 UI:开发者可在ChatGPT对话流中渲染完全互动的用户界面,支持视频播放器、互动地图、设计画板等复杂UI直接嵌入。
- 基于 MCP 标准:Apps SDK建立在MCP这一开放标准之上,开发者对后端逻辑和前端UI拥有完全控制权,且该标准公开,任何平台均可整合。
对开发者而言,最大的吸引力在于分发渠道。应用一旦构建完成,便有机会触达ChatGPT全球数亿用户群体,极大改变产品规模化扩展方式。同时,OpenAI也考虑了商业化需求。若用户已是开发者现有产品的订阅者,可直接在对话中登录账户。未来,OpenAI还将支持多种变现方式,包括新的Agentic Commerce Protocol(智能体商业协议),允许在ChatGPT内部实现即时结账。
在现场演示中,软件工程师Alexi展示了几个首批合作伙伴的应用,生动诠释了这种新模式的魅力:
-
Coursera(在线课程平台):用户可直接呼叫Coursera应用学习特定主题。应用在对话中嵌入课程视频,支持画中画或全屏播放。用户观看视频时,可随时向ChatGPT提问关于当前视频内容的问题,例如“请解释一下他们现在正在说的概念”。由于Apps SDK允许应用将上下文(context)暴露给模型,ChatGPT能准确理解用户正在观看的视频片段,并给出精准回答,将学习体验提升至全新高度。

-
Canva(设计平台):在为宠物狗遛弯业务进行头脑风暴的对话中,用户可直接呼叫Canva,用自然语言指令制作作品集,例如“Canva,用这个名字为我制作一个作品集,我希望它色彩丰富、异想天开、明亮,并使用无衬线字体”。Canva应用在对话中生成设计选项,用户可进一步迭代,将海报转化为融资简报。整个创意流程在同一对话窗口中无缝完成。

-
Zillow(房地产平台):当对话涉及业务扩张并选择新城市匹兹堡时,用户可接着呼叫Zillow应用,要求“显示那里的待售房屋”。Zillow在对话中嵌入互动地图。用户可切换全屏模式,浏览房屋详情,甚至直接在地图上发起预约看房。用户还能继续用自然语言操作Zillow应用,例如“将地图筛选为仅显示带院子的三居室房屋”。ChatGPT理解指令并更新地图。此外,用户选定房产后,可询问“这处房产离狗狗公园有多远?”,ChatGPT会结合Zillow应用提供的房屋位置信息及其自身搜索工具,提供综合性答案。

这些演示清晰表明,Apps in ChatGPT不仅是API的简单调用,更是将语言模型的理解能力与应用的丰富功能和互动界面深度融合,创造出前所未有的动态体验。
目前,Apps SDK已向开发者提供预览版。今年晚些时候,开发者将能提交应用进行审核和发布,届时还将推出一个应用目录(Directory)供用户浏览。符合基本标准的应用都将被收录,而那些在设计和功能上表现更出色的应用,将获得更显著的推荐位置,甚至在对话中被主动建议给用户。
https://developers.openai.com/apps-sdk
AgentKit:在几分钟内将智能体从原型带入生产环境
智能体(Agent),即能理解上下文、使用工具并自主完成任务的软件,被普遍认为是AI的下一个重要发展方向。然而,尽管相关讨论热烈,但真正能投入生产并被大规模使用的智能体却寥寥无几。其原因在于开发过程异常复杂,开发者需处理诸多难题:从选择合适框架,到编排复杂工作流、建立评估循环、连接各种工具,再到构建友好用户界面,每一步都充满挑战。
为解决这些痛点,让每位开发者能更快速地将想法转化为可用智能体,OpenAI推出了全新的AgentKit。这是一套内置于OpenAI平台中的完整构建模块,旨在帮助开发者以更少时间和精力,完成从原型设计到生产部署的全过程。
AgentKit核心包含三大组件,以及一个强大的连接器生态系统:
-
1.Agent Builder(智能体构建器):这是一个可视化的工作流设计工具。开发者无需从头编写复杂协调代码,通过拖拽节点即可设计智能体逻辑步骤、测试流程。这些节点包括工具调用、人类介入环节、安全护栏和逻辑判断等。它建立在已有数十万开发者使用的Responses API之上,对平台老用户而言易于上手。
-
2.ChatKit(聊天工具包):为使智能体拥有精美用户界面,OpenAI提供了ChatKit。它是一个简单、可嵌入的聊天界面组件,开发者可轻松集成到应用中,并进行品牌化定制(如修改颜色、Logo和提示语),从而专注于核心业务逻辑,无需在前端界面上耗费过多时间。
-
3.Evals for Agents(智能体评估):衡量智能体性能至关重要。AgentKit提供了一套专门的评估功能,包括:
- Trace Grading(追踪评分):逐一审视智能体每一步决策过程,深入理解其行为。
- Datasets(数据集):允许针对工作流中特定节点进行性能评估。
- Automated Prompt Optimization(自动化提示优化):帮助自动调整和改进提示词,以获得更好性能。
- External Model Evals(外部模型评估):甚至支持在OpenAI Evals平台内直接对外部模型进行评估。
-
Connector Registry(连接器注册中心):智能体需要安全访问数据和工具。通过此管理控制面板,企业可安全地将智能体连接到内部工具和第三方系统,同时确保数据安全和权限可控。
现场演示中,Christina发起挑战:在8分钟内为DevDay官方网站构建并部署一个问答智能体“Ask Froge”。
相关视频已翻译并提供,便于读者直观理解。
设计工作流(在 Agent Builder 中):
1. 她首先拖入一个分类器节点,用于判断用户提问是关于“会议日程”还是“一般信息”。
2. 接着,她创建了两个专门的智能体节点。“日程智能体”上传了包含所有会议信息的文档作为知识源;“DevDay 通用智能体”提供了通用信息文件,并设定角色风格(像一只名为 Froge 的青蛙说话,会发出 "ribbit" 的声音)。
3. 为使日程推荐更具视觉吸引力,她使用 Widget Builder(小组件构建器) 设计了一个精美日程卡片,并将其附加到“日程智能体”的输出格式中。
4. 为增强安全性,她添加了一个预置的 Guardrail(护栏) 节点,用于自动屏蔽个人身份信息(PII)。
5. 整个工作流设计完成后,她在 Agent Builder 的预览窗口中进行了测试,确认其能正确回答问题并以预期方式呈现结果。
部署到网站:
1. 她点击“发布”,AgentKit 为这个工作流生成了一个唯一的 ID。
2. 然后,她来到 DevDay 网站的代码中,仅用几行代码就完成了部署:引入了 ChatKit 的 React 组件,将生成的工作流 ID 传入,并添加了一些自定义样式,如 Froge 主题颜色和提示语。
3. 刷新网站,一个名为 "Ask Froge" 的聊天机器人已出现在页面右下角,并完全可用。
整个过程从设计到部署,耗时不到8分钟。此演示完美展示了AgentKit如何将原本需要数周开发时间的复杂任务缩短到几分钟。更重要的是,后续迭代可直接在可视化的Agent Builder中完成,修改后的智能体无需重新部署代码即可在网站上生效。
Codex
Codex更新
今天,Codex正式结束研究预览,进入通用可用阶段。推出了一系列新功能:
- Slack 集成:开发者可直接在Slack团队对话中要求Codex编写代码或回答问题。
- Codex SDK:新的开发工具包,帮助团队将Codex能力扩展和自动化到自己的工作流中。
- 新的管理工具和报告:包括环境控制、监控和分析仪表板,帮助企业更好地管理Codex使用。
现场演示中,Romain展示了如何利用Codex和OpenAI的API,将周围物理世界变为可交互软件。
相关演示视频全过程已提供。
从草图到 UI:Romain 首先展示了一张他手绘的 UI 草图,然后使用Codex CLI(命令行工具) 将其转换成一个带有摄像头画面的控制面板界面。
控制物理设备:他遇到的第一个挑战是发布会控制舞台上方的 Sony FR7 摄像机。Romain 对此一无所知,只知道该摄像机有一个 C++ SDK。他直接向 Codex 下达任务,Codex 自主研究了有 30 年历史的 VISCA 协议,并用 JavaScript 实现了控制逻辑。Romain 强调,Codex 能够不知疲倦地执行长达数小时的复杂任务。
实时添加新功能:接着,Romain 在 VS Code 中向 Codex 插件下达一个新任务:“将一个无线控制器连接起来以控制摄像机”。Codex 在后台开始分析现有代码,制定计划并实现功能。几分钟后,Romain 拿起一个 Xbox 手柄,成功控制了摄像机的移动。
多模态与多工具协作:演示高潮是引入语音控制。他利用 OpenAI 的实时语音 API 和 Agent SDK,为应用添加了语音交互能力。然后,他向 Codex 发出指令,要求为舞台的灯光系统创建一个 MCP 服务器,并提供了灯光系统的参考文档。Codex 在执行任务时,发现文档信息不全,于是自主上网搜索 GitHub 上的文档,补全了所需信息,最终成功创建了服务器。
人机协同编程的未来:演示最后,Romain 通过语音向应用下达指令:“让 Codex 显示一个类似电影结尾的演职员表,演员是现场的观众们”。应用中的语音智能体将此请求转发给了 Codex SDK。Codex 实时分析了前端应用的代码,注入了新的 React 组件,并在屏幕上滚动显示出演职员表。
此现场演示展示了Codex开发全过程:从草图、物理设备、语音指令到实时应用重构,整个过程几乎没有手写一行代码。Codex真正成为了一位能理解意图、解决未知问题并与开发者并肩工作的智能队友。
模型与 API 更新
- GPT-5 Pro API 开放
- GPT-Realtime-Mini API 开放
- Sora 2 API 预览版发布
写在最后
DevDay 2025的所有发布都指向一个共同目标:OpenAI致力于为新的开发者时代提供最佳平台。从在ChatGPT内部分发应用的Apps SDK,到简化智能体开发的AgentKit,再到Codex,以及GPT-5 Pro、Sora 2和Realtime-Mini等更强大的模型API,OpenAI正在全方位赋能开发者。
Sam Altman表示,软件开发曾是需要数月甚至数年才能完成的漫长过程,但如今,其可在几分钟内完成。在这个新时代,开发者所需的仅仅是一个好的想法。
这是一个属于所有新开发者的黄金时代。开发者需要思考是否已做好准备,迎接这一新时代。
