
OpenAI在开发者大会DevDay 2025上公布了一系列重磅更新,主要内容涵盖:
- 在ChatGPT中引入Apps:可以直接在ChatGPT进行自然对话的Apps,以及供开发者构建自己应用程序的全新Apps SDK(预览版)
- AgentKit:一整套用于开发者和企业构建、部署与优化Agent的完整工具集
- 新模型API:Sora 2、Sora 2 Pro、GPT-5 Pro、gpt-image-1-mini 和 gpt-realtime-mini
- Codex GA:Codex 现已全面可用,同时推出三项新功能。
在ChatGPT中引入Apps
OpenAI正式推出了新一代可以直接在ChatGPT中自然对话的Apps。这些Apps与对话体验完美融合,能够理解自然语言,并提供可在聊天中直接交互的界面。对用户而言,ChatGPT 内的Apps能主动提供帮助,并根据上下文进行适配,助力用户更高效地创作、学习和完成任务。
用户可以直接通过名称调用App,例如输入:“Spotify,帮我为这周五的派对创建一个播放列表。”,ChatGPT 会在聊天中自动唤出 Spotify 应用,并利用相关上下文提供帮助。ChatGPT 还会根据上下文主动推荐相关应用,例如当用户谈论买新房时,ChatGPT 可能会建议使用 Zillow 应用,让用户直接在 ChatGPT 内的交互式地图上浏览符合预算的房源。
所有ChatGPT用户均可使用此新功能,无论是免费用户还是付费用户。首批试点合作伙伴包括Booking.com、Canva、Coursera、Figma、Expedia、Spotify 和 Zillow,这些Apps已在其提供服务的地区上线(首先支持英文)。


预计今年晚些时候将有另外11家合作伙伴接入:
此外,OpenAI还推出了供开发者构建自己应用程序的全新Apps SDK(预览版),它基于Model Context Protocol(MCP),让 ChatGPT 能连接外部工具与数据,并支持开发者同时设计应用逻辑与界面。开发者可使用自有代码定义交互与对话逻辑,直接连接后端,实现用户登录与高级功能。官方也提供了开发文档、设计指南和示例仓库,帮助快速上手构建自然对话式应用:https://developers.openai.com/apps-sdk。
AgentKit
OpenAI正式推出AgentKit,这是一整套用于开发者和企业构建、部署与优化Agent的完整工具集。以往,构建一个Agent常涉及繁琐的流程,包括复杂的编排、自定义连接器、手动评估、提示词调优,以及耗时数周的前端界面开发。AgentKit的推出,为开发者提供了全新的构建模块,使其能以可视化方式快速设计工作流,并更便捷地嵌入智能体交互界面,主要组件有:
- Agent Builder:用于创建和版本管理多Agent工作流的可视化画布
- Connector Registry:管理员可在此集中管理数据和工具在 OpenAI 产品间的连接方式
- ChatKit:一套可嵌入产品中的、可自定义的聊天式Agent体验工具包
开发者可以直接使用 Agent Builder 设计工作流:Agent Builder 提供了一个可视化画布,通过拖拽节点来组合逻辑、连接工具,并配置自定义防护规则。完整指南见:

防护规则可通过Guardrails进行设置。Guardrails是OpenAI推出的一个开源、模块化的安全层,旨在防止Agent出现意外或恶意行为,例如屏蔽或标记个人隐私信息、检测越狱行为等。
为Agent部署聊天界面通常比预期更为复杂,需要处理流式响应、会话线程管理、模型思考过程展示以及设计富有吸引力的聊天交互体验。然而,ChatKit简化了这一过程。它能帮助开发者轻松嵌入基于聊天的智能体,使其自然融入产品。ChatKit可嵌入到应用或网站中,并可根据主题或品牌风格进行自定义。以下是一些具体的应用例子:
此外,OpenAI还推出了全新的Evals功能,用于评估Agent性能。该功能新增了数据集、追踪评分、自动提示词优化和第三方模型支持等特性,旨在衡量并改进Agent表现。
- 数据集:快速从零构建智能体评估,并通过自动评分器和人工标注不断扩展。
- 追踪评分:对智能体工作流进行端到端评估,并自动评分以精准发现不足。
- 自动提示词优化:根据人工标注和评分器结果生成优化提示词。
- 第三方模型支持:在 OpenAI Evals 平台上评估其他供应商的模型。
此外,OpenAI还提供了强化微调(Reinforcement Fine-Tuning, RFT)服务,以提升Agent性能。RFT允许开发者定制OpenAI的推理模型。目前,RFT已在OpenAI o4-mini上全面可用,并在GPT‑5上处于私测阶段。RFT私测版还推出了两项旨在进一步提升Agent性能的新功能:
- 自定义工具调用:训练模型在合适的时机调用正确的工具,从而提升推理能力
- 自定义评分器:为应用场景设定最重要的评估标准
ChatKit和Evals功能面向所有开发者开放,调用模型则按照API价格正常收费。
Sora 2 API
Sora 2现已推出API,包含Sora 2和Sora 2 Pro两个版本。
Sora 2可生成720P视频(1280×720或720×1280),每秒收费0.30美元,生成10秒视频约21.36元人民币;生成1080P视频每秒收费0.50美元,10秒视频约35.6元人民币。
与Google Veo 3相比,Sora 2的API价格具有竞争力。

GPT-5 Pro API
此外,GPT-5 Pro也已开放API,该模型引入了更长的思考时间(仅支持 reasoning.effort: high),适用于处理更复杂的任务。

然而,其价格相对较高,每百万Token的输入和输出价格均为120.00美元:
此价格是普通GPT-5的12倍:
GPT-5的API还带来了两项额外更新:
- 在优先处理层(见Priority processing),GPT-5 API 请求比标准层快 40%。
- 新增服务健康仪表盘,可监控系统上线时间、请求响应时间、Token 处理速度以及首个 Token 响应时间。
gpt-image-1-mini 和 gpt-realtime-mini
此外,OpenAI还推出了成本更低的图像模型gpt-image-1-mini:

与标准版gpt-image-1相比,gpt-image-1-mini的价格便宜80%:


此外,还推出了价格便宜70%的gpt-realtime-mini模型:
Codex GA
Codex现已推出正式可用版本(GA),并新增三项功能,进一步提升其对工程团队的价值:
- 全新 Slack 集成:用户可以直接在团队频道或线程中将任务委派给 Codex 或向其提问。
- Codex SDK:将驱动Codex CLI的同款智能体嵌入至工作流、工具和应用中,无需额外调优,即可在GPT‑5-Codex上实现顶尖性能。
- 新管理工具:通过环境控制、监控与分析仪表盘,ChatGPT工作区管理员能更清晰地管理Codex,实现大规模可视化与控制。
