OpenAI Dev Day 2025全速览：ChatGPT迈入应用时代，Agent与多模态API重塑AI生态格局

在OpenAI 2025年度发布会上，OpenAI发布了一系列重磅更新。本次大会主要聚焦于以下关键领域：

Contents

一、ChatGPT 正式进入“应用时代”二、AgentKit：积木式搭建智能体三、OpenAI Codex：AI编程模型四、支持的多模态模型API 写在最后

App in ChatGPT：ChatGPT将第三方APP能力内置为智能体的工具，实现自主调用。
Agent Kit：OpenAI推出面向开发者的Agent工具包，其功能涵盖了Agent空间、罗盘及开发平台的工作流，旨在赋能开发者。
Codex 正式版：作为AI编程模型，Codex对标并超越了其他同类产品，其正式发布将为开发者带来更优体验。
多模态API发布：涵盖对话模型GPT-5 Pro、图像生成gpt-image-1-mini、多模态视频生成Sora、多模态语音对话Real-Time Mini。

OpenAI Dev Day 2025发布会核心内容概览

可以看出，OpenAI在Agent平台、前沿全模态API以及AI编程等领域全面发力。未来AI发展的核心关键词将聚焦于Agent、AI编程和基础模型。以下将对各项发布内容进行详细解析。

一、ChatGPT 正式进入“应用时代”

正如当年微信小程序上线带来的惊喜，如今ChatGPT也迎来了其“小程序时代”——Apps in ChatGPT。

这意味着用户不仅可以与ChatGPT对话，还能在对话界面内无缝使用Canva设计海报、Spotify创建歌单、Booking.com预订酒店以及Coursera学习课程等第三方服务。

💬 什么是「ChatGPT 应用」？

设想以下对话场景：

Spotify，帮我做一个适合周五派对的歌单。

ChatGPT调用Spotify生成歌单示例

ChatGPT自动调用Spotify，在聊天界面里生成播放列表。

或者：

我下个月想去巴黎玩三天，帮我订个酒店。

ChatGPT通过Booking.com预订酒店示例

ChatGPT直接打开Booking.com的结果卡片，用户可以边聊边选房、看图、确认预订。

所有操作均可在聊天界面内直接完成，无需切换应用或打开其他网页。

🧩 开放情况：即刻体验

目前，Apps功能已面向所有已登录的ChatGPT用户（包括Free、Go、Plus、Pro版）开放，欧盟地区暂不包含在内。

首批上线的合作伙伴包括：

🏨 Booking.com（酒店预订）

🎨 Canva（在线设计）

🎓 Coursera（学习课程）

✈️ Expedia（旅行规划）

🧩 Figma（原型设计）

🎵 Spotify（音乐播放）

🏠 Zillow（房地产）

未来还将陆续上线更多合作方：

未来将接入ChatGPT的更多第三方合作伙伴列表

如Uber、Target、Peloton、AllTrails、OpenTable等。

🧑‍💻 对开发者：Apps SDK 开放预览

OpenAI同时发布了Apps SDK（开发工具包），旨在赋能开发者轻松创建自己的ChatGPT应用。

开发者可用其实现：

定义App的界面与逻辑；
连接自有后台或数据库；
支持登录、会员、个性化内容；
让App在ChatGPT内与数亿用户自然对话。

这套SDK基于开放标准Model Context Protocol (MCP) 构建，这意味着未来这些App也可以在任何支持MCP的平台运行。

简而言之，ChatGPT正逐步演变为一个“对话式操作系统”。

💰 未来方向：应用商店与变现机制

OpenAI计划于今年晚些时候面向开发者启动商业变现机制，具体措施包括：

启动ChatGPT应用目录（App Store）；
开放开发者提交与审核机制；
推出变现功能，并支持「Agentic Commerce Protocol」实现对话内支付。

这意味着未来用户不仅可以“用App”，还可能“在ChatGPT上卖App”。

🌍 新的时代：ChatGPT——对话式超级平台

过去我们习惯在手机上安装应用；未来，或许只需一句话。

“帮我设计一张新品发布海报。” —— Canva立刻上线；

ChatGPT调用Canva设计海报示例

“我想规划一次东京旅行。” —— Expedia自动出现；

ChatGPT调用Expedia规划旅行示例

“我想提高英语听力。” —— Coursera教程一键开启。

ChatGPT调用Coursera学习课程示例

ChatGPT正逐渐发展为一个由自然语言驱动的操作系统，赋能每个人通过聊天来调用强大的工具与服务。

Apps in ChatGPT = 聊天中的App Store。

通过聊天即可预订酒店、学习课程、进行设计或享受音乐。预计在未来五年内，这将彻底改变我们与AI及互联网的交互模式。

二、AgentKit：积木式搭建智能体

AgentKit是一套全新的工具系统，旨在赋能开发者和企业以“搭积木”的方式轻松构建、部署及优化智能体（Agent）。

ChatGPT正从“对话式AI”向“可执行AI”演进，全面迈入“智能体时代”。

🧩 AgentKit核心阐释：

以往构建智能体常需手动编写复杂逻辑、管理版本、连接外部工具，并投入数周时间进行前端开发与性能调试。

而AgentKit则简化了这一流程，通过拖拽节点和简单配置，即可完成智能体的设计、部署到优化全过程。

AgentKit智能体可视化搭建界面

AgentKit将AI从“聪明的聊天对象”转变为“高效的数字员工”。

🔧 AgentKit三大核心功能集成：

1️⃣ Agent Builder —— 智能体的「可视化大脑」

Agent Builder提供一个拖拽式画布，使用户能够轻松设计多智能体协作流程。

Agent Builder拖拽式智能体设计画布

用户可在画布上连接各类模块，包括判断、搜索、工具调用和对话逻辑，并支持一键测试、版本管理及安全规则设置（如防越狱、防隐私泄露）。

💬 实战案例：

Ramp公司将原本需要两个月的智能体开发周期，通过Agent Builder缩短至两次迭代上线。

企业利用AgentKit构建智能客服与知识助手的成功案例

LY Corporation（日本科技巨头）仅用两小时便打造出办公助理智能体。

如今，法务、产品、工程师等不同职能人员均可轻松参与AI的构建。

2️⃣ Connector Registry —— 数据与工具的「中控台」

Connector Registry是企业期待已久的解决方案。

Connector Registry统一管理数据与工具连接界面

它能够统一管理所有数据源与工具的连接，例如Dropbox、Google Drive、Teams和SharePoint。

解决了以往企业中不同部门、不同账号数据与工具连接混乱的普遍问题。

现在，只需一个控制面板即可完成所有API接入与权限配置。

3️⃣ ChatKit —— 聊天智能体的无缝嵌入

ChatKit提供一键嵌入式的聊天用户界面（UI）。

开发者可在自有网站、App或后台系统中嵌入ChatGPT风格的智能体对话界面，实现流式响应、消息管理及品牌定制。

💡 典型应用案例：

Canva利用ChatKit为其开发者社区上线了智能体客服，仅用1小时即完成集成；

Canva使用ChatKit打造智能客服的界面

HubSpot、Ramp、Evernote等公司也已用它打造智能客服和知识助手。

企业利用AgentKit构建智能客服与知识助手的成功案例

总结而言，ChatKit将“对话界面”打造成为AI产品的标准配置。

📊 评估与优化：Evals新升级，提升AI可靠性

OpenAI同步强化了智能体评估系统Evals，新增功能包括：

📁 Datasets：快速创建测试集，并支持自动评分；

Evals新功能：智能体评估测试集创建界面

🔍 Trace Grading：端到端评估整个智能体工作流；

Evals新功能：智能体工作流端到端评估

🧩 Prompt 优化：自动改写提示词，以提升表现；

Evals新功能：提示词自动优化示例

🧠 强化微调（RFT）：提升智能体个性化理解

AgentKit还支持强化微调（Reinforcement Fine-Tuning），使模型能更好地理解业务核心逻辑。

🧰 Custom Tool Calls：训练模型在正确的时间调用正确工具；
🧾 Custom Graders：自定义评估标准。

目前此功能已在o4-mini上全面开放，GPT-5正在私测中。

💰 开放与定价一览

模块	状态	说明
ChatKit	✅ 已全面开放	所有开发者均可使用
Evals 新功能	✅ 已上线	无额外费用
Agent Builder	🧪 Beta 测试中	面向部分开发者开放
Connector Registry	🧪 Beta 阶段	企业可申请使用（需 Global Admin Console）

全部功能均按标准API计费，无额外溢价。

ChatGPT的下一步，不只是回答问题，而是能“理解意图、调用工具、完成任务”。

AgentKit的发布意味着：

对开发者：从“编写代码”转变为“设计智能流程”；
对企业：从“AI工具”升级为“AI团队”；
对普通用户：未来接触到的每个智能助理，可能都诞生在AgentKit平台上。

OpenAI进一步表示，未来将推出Workflows API（直接部署智能体）、ChatGPT内置智能体管理，以及支持智能体变现与目录上架的生态计划。

💬 官方表述：

“We can’t wait to see what you build.” —— OpenAI 团队

三、OpenAI Codex：AI编程模型

即日起，OpenAI Codex正式全面开放。

这标志着开发者的编程世界将迎来一位真正理解开发、能高效协作并具备自我进化能力的智能队友。

✨ Codex三大重磅新功能

1️⃣ Slack集成：将Codex引入团队协作

只需在Slack里@Codex，它就能：

自动理解上下文 🧠
选择合适的环境执行任务 ⚙️
生成结果并返回链接 🔗

无论是修复bug、编写脚本还是代码review，Codex均能直接协助完成。

如同一个24小时在线的AI同事。

2️⃣ Codex SDK：无缝嵌入工作流

只需几行代码，即可在工具或应用中集成Codex。

目前支持TypeScript，更多语言即将到来。

无论在本地终端、云端环境还是CI/CD管线中，Codex都能实现无缝协作。

3️⃣ 管理功能升级：提升安全性与可控性

ChatGPT工作区管理员现在可以管理Codex环境（编辑、删除）、设置默认安全策略，并实时监控使用数据与代码质量。

全新的仪表盘使团队的AI协作更为透明化与可追踪。

📈 使用方式与定价

✅ Slack集成 & Codex SDK

现已向ChatGPT Plus / Pro / Business / Edu / Enterprise用户开放。

✅ 新的管理员功能

面向Business / Edu / Enterprise计划开放。

自10月20日起，Codex云端任务将开始计入使用量，详细定价信息请参考OpenAI官方说明。

四、支持的多模态模型API

1、Sora 2 API

开发者现在可通过API集成最新的Sora 2模型，将视频生成能力引入其应用程序。

AI终于实现了“视频创作”的能力。

OpenAI最新发布的Sora API，使开发者仅需一句自然语言描述，即可生成包含画面、动作及声音的完整视频。

🌌 Sora模型介绍

Sora是OpenAI最新的多模态视频生成模型，能够从文字或图片输入中生成高保真、富有节奏感并带音频的动态视频。

相较于以往的图像生成模型，Sora对3D空间感、光影效果、运动轨迹与场景连续性均展现出更深层次的理解。

⚙️ 视频API开放：五大核心能力集成

现在，开发者可以直接通过API调用这些功能：

1️⃣ 创建视频：输入prompt，启动视频生成任务

2️⃣ 获取状态：查看生成进度、排队状态

3️⃣ 下载视频：渲染完成后获取MP4文件

4️⃣ 列出视频：管理项目历史与素材库

5️⃣ 删除视频：清理无用素材

Sora API支持全流程自动化与可编程，无论开发App、内容平台、短视频工具，抑或广告生成引擎，Sora均能成为其核心的“AI导演”。

🧠 两款模型开放：速度版与电影版

模型	特点	适合场景
🎞️Sora 2	快速生成、灵活迭代	概念草图、社交视频、内容原型
🎬Sora 2 Pro	高质量输出、细节丰富	影视级画面、品牌广告、营销素材

Sora 2适合快速原型制作，而Sora 2 Pro则适用于高质量影视级内容创作。

未来，品牌广告、短片、教育内容、游戏预告及动画草图等多种形式的创作，均可能从一行文字描述开始。

2、GPT-5 Pro API

若认为GPT-5已足够强大，GPT-5 Pro将重新定义智能模型的能力边界。它不仅能够回答问题，更具备深度“思考”的能力。

GPT-5 Pro的特点在于其更深度推理能力、更稳定输出表现及超长上下文处理能力。

⚡️ GPT-5 Pro核心特性：

GPT-5 Pro模型深度推理能力示意图

🔹 运用更强的算力，使模型在生成回答前进行更长时间的深度思考；
🔹 能够进行多轮推理、复杂逻辑分析及跨文档理解；
🔹 支持长达40万的上下文窗口；
🔹 输出上限高达27.2万tokens；
🔹 知识截止日期：2024年9月30日。

🧩 GPT-5 Pro独特之处：

✨ 专为高推理任务设计

GPT-5 Pro默认开启最高级别的推理模式（reasoning.effort: high），确保每一个回答都经过更深层的逻辑演算与验证。

🚫 不支持代码解释器

它并非专注于代码生成，而是作为一款智囊模型，擅长分析论文、规划商业方案以及审视复杂系统。

⚙️ 仅在Responses API中提供

为支持多轮模型交互、背景模式执行等高级功能。

💵 定价信息：

GPT-5 Pro尤其适用于需要深度分析且涉及大量输入与超长输出的任务。

模型	输入（/ 1M tokens）	输出（/ 1M tokens）
GPT-5 Pro	💲15.00	💲120.00
o3-Pro	💲20.00	💲—
GPT-5	💲1.25	💲—

详情可访问：platform.openai.com/docs/models/gpt-5-pro

3、gpt-realtime-mini

对于追求低成本实时AI对话的用户而言，gpt-realtime-mini是不可错过的选择。

gpt-realtime-mini实时AI对话模型示意图

作为GPT Realtime的轻量级版本，它支持在WebRTC、WebSocket及SIP协议上轻松实现音频和文字的实时交互。

详情可访问：platform.openai.com/docs/models/gpt-realtime-mini

4、gpt-image-1-mini

gpt-image-1-mini能够满足用户对AI快速生成图片且控制成本的需求！

gpt-image-1-mini AI图像快速生成模型示意图

💡 应用场景：

gpt-image-1-mini特别适用于原型设计、快速概念生成及低成本项目测试。

详情可访问：platform.openai.com/docs/models/gpt-image-1-mini

写在最后

未来AI发展前景广阔，并日益趋向于应用落地。

AI技术的快速发展，对缺乏技术壁垒的创新者构成了挑战，此类创新终将成为时代的尘埃。

未来的发展路径尚无定论，或许应用创新值得探索。