在OpenAI 2025年度发布会上,OpenAI发布了一系列重磅更新。本次大会主要聚焦于以下关键领域:
- App in ChatGPT:ChatGPT将第三方APP能力内置为智能体的工具,实现自主调用。
- Agent Kit:OpenAI推出面向开发者的Agent工具包,其功能涵盖了Agent空间、罗盘及开发平台的工作流,旨在赋能开发者。
- Codex 正式版:作为AI编程模型,Codex对标并超越了其他同类产品,其正式发布将为开发者带来更优体验。
- 多模态API发布:涵盖对话模型GPT-5 Pro、图像生成gpt-image-1-mini、多模态视频生成Sora、多模态语音对话Real-Time Mini。

可以看出,OpenAI在Agent平台、前沿全模态API以及AI编程等领域全面发力。未来AI发展的核心关键词将聚焦于Agent、AI编程和基础模型。以下将对各项发布内容进行详细解析。
一、ChatGPT 正式进入“应用时代”
正如当年微信小程序上线带来的惊喜,如今ChatGPT也迎来了其“小程序时代”——Apps in ChatGPT。
这意味着用户不仅可以与ChatGPT对话,还能在对话界面内无缝使用Canva设计海报、Spotify创建歌单、Booking.com预订酒店以及Coursera学习课程等第三方服务。
💬 什么是「ChatGPT 应用」?
设想以下对话场景:
Spotify,帮我做一个适合周五派对的歌单。

ChatGPT自动调用Spotify,在聊天界面里生成播放列表。
或者:
我下个月想去巴黎玩三天,帮我订个酒店。

ChatGPT直接打开Booking.com的结果卡片,用户可以边聊边选房、看图、确认预订。
所有操作均可在聊天界面内直接完成,无需切换应用或打开其他网页。
🧩 开放情况:即刻体验
目前,Apps功能已面向所有已登录的ChatGPT用户(包括Free、Go、Plus、Pro版)开放,欧盟地区暂不包含在内。
首批上线的合作伙伴包括:
🏨 Booking.com(酒店预订)
🎨 Canva(在线设计)
🎓 Coursera(学习课程)
✈️ Expedia(旅行规划)
🧩 Figma(原型设计)
🎵 Spotify(音乐播放)
🏠 Zillow(房地产)
未来还将陆续上线更多合作方:

如Uber、Target、Peloton、AllTrails、OpenTable等。
🧑💻 对开发者:Apps SDK 开放预览
OpenAI同时发布了Apps SDK(开发工具包),旨在赋能开发者轻松创建自己的ChatGPT应用。
开发者可用其实现:
- 定义App的界面与逻辑;
- 连接自有后台或数据库;
- 支持登录、会员、个性化内容;
- 让App在ChatGPT内与数亿用户自然对话。
这套SDK基于开放标准Model Context Protocol (MCP) 构建,这意味着未来这些App也可以在任何支持MCP的平台运行。
简而言之,ChatGPT正逐步演变为一个“对话式操作系统”。
💰 未来方向:应用商店与变现机制
OpenAI计划于今年晚些时候面向开发者启动商业变现机制,具体措施包括:
- 启动ChatGPT应用目录(App Store);
- 开放开发者提交与审核机制;
- 推出变现功能,并支持「Agentic Commerce Protocol」实现对话内支付。
这意味着未来用户不仅可以“用App”,还可能“在ChatGPT上卖App”。
🌍 新的时代:ChatGPT——对话式超级平台
过去我们习惯在手机上安装应用;未来,或许只需一句话。
“帮我设计一张新品发布海报。” —— Canva立刻上线;

“我想规划一次东京旅行。” —— Expedia自动出现;

“我想提高英语听力。” —— Coursera教程一键开启。

ChatGPT正逐渐发展为一个由自然语言驱动的操作系统,赋能每个人通过聊天来调用强大的工具与服务。
Apps in ChatGPT = 聊天中的App Store。
通过聊天即可预订酒店、学习课程、进行设计或享受音乐。预计在未来五年内,这将彻底改变我们与AI及互联网的交互模式。
二、AgentKit:积木式搭建智能体
AgentKit是一套全新的工具系统,旨在赋能开发者和企业以“搭积木”的方式轻松构建、部署及优化智能体(Agent)。
ChatGPT正从“对话式AI”向“可执行AI”演进,全面迈入“智能体时代”。
🧩 AgentKit核心阐释:
以往构建智能体常需手动编写复杂逻辑、管理版本、连接外部工具,并投入数周时间进行前端开发与性能调试。
而AgentKit则简化了这一流程,通过拖拽节点和简单配置,即可完成智能体的设计、部署到优化全过程。

AgentKit将AI从“聪明的聊天对象”转变为“高效的数字员工”。
🔧 AgentKit三大核心功能集成:
1️⃣ Agent Builder —— 智能体的「可视化大脑」
Agent Builder提供一个拖拽式画布,使用户能够轻松设计多智能体协作流程。

用户可在画布上连接各类模块,包括判断、搜索、工具调用和对话逻辑,并支持一键测试、版本管理及安全规则设置(如防越狱、防隐私泄露)。
💬 实战案例:
Ramp公司将原本需要两个月的智能体开发周期,通过Agent Builder缩短至两次迭代上线。

LY Corporation(日本科技巨头)仅用两小时便打造出办公助理智能体。
如今,法务、产品、工程师等不同职能人员均可轻松参与AI的构建。
2️⃣ Connector Registry —— 数据与工具的「中控台」
Connector Registry是企业期待已久的解决方案。

它能够统一管理所有数据源与工具的连接,例如Dropbox、Google Drive、Teams和SharePoint。
解决了以往企业中不同部门、不同账号数据与工具连接混乱的普遍问题。
现在,只需一个控制面板即可完成所有API接入与权限配置。
3️⃣ ChatKit —— 聊天智能体的无缝嵌入
ChatKit提供一键嵌入式的聊天用户界面(UI)。
开发者可在自有网站、App或后台系统中嵌入ChatGPT风格的智能体对话界面,实现流式响应、消息管理及品牌定制。
💡 典型应用案例:
Canva利用ChatKit为其开发者社区上线了智能体客服,仅用1小时即完成集成;

HubSpot、Ramp、Evernote等公司也已用它打造智能客服和知识助手。

总结而言,ChatKit将“对话界面”打造成为AI产品的标准配置。
📊 评估与优化:Evals新升级,提升AI可靠性
OpenAI同步强化了智能体评估系统Evals,新增功能包括:
📁 Datasets:快速创建测试集,并支持自动评分;

🔍 Trace Grading:端到端评估整个智能体工作流;

🧩 Prompt 优化:自动改写提示词,以提升表现;

🧠 强化微调(RFT):提升智能体个性化理解
AgentKit还支持强化微调(Reinforcement Fine-Tuning),使模型能更好地理解业务核心逻辑。
- 🧰 Custom Tool Calls:训练模型在正确的时间调用正确工具;
- 🧾 Custom Graders:自定义评估标准。
目前此功能已在o4-mini上全面开放,GPT-5正在私测中。
💰 开放与定价一览
| 模块 | 状态 | 说明 |
|---|---|---|
| ChatKit | ✅ 已全面开放 | 所有开发者均可使用 |
| Evals 新功能 | ✅ 已上线 | 无额外费用 |
| Agent Builder | 🧪 Beta 测试中 | 面向部分开发者开放 |
| Connector Registry | 🧪 Beta 阶段 | 企业可申请使用(需 Global Admin Console) |
全部功能均按标准API计费,无额外溢价。
ChatGPT的下一步,不只是回答问题,而是能“理解意图、调用工具、完成任务”。
AgentKit的发布意味着:
- 对开发者:从“编写代码”转变为“设计智能流程”;
- 对企业:从“AI工具”升级为“AI团队”;
- 对普通用户:未来接触到的每个智能助理,可能都诞生在AgentKit平台上。
OpenAI进一步表示,未来将推出Workflows API(直接部署智能体)、ChatGPT内置智能体管理,以及支持智能体变现与目录上架的生态计划。
💬 官方表述:
“We can’t wait to see what you build.” —— OpenAI 团队
三、OpenAI Codex:AI编程模型
即日起,OpenAI Codex正式全面开放。
这标志着开发者的编程世界将迎来一位真正理解开发、能高效协作并具备自我进化能力的智能队友。
✨ Codex三大重磅新功能
1️⃣ Slack集成:将Codex引入团队协作
只需在Slack里@Codex,它就能:
- 自动理解上下文 🧠
- 选择合适的环境执行任务 ⚙️
- 生成结果并返回链接 🔗
无论是修复bug、编写脚本还是代码review,Codex均能直接协助完成。
如同一个24小时在线的AI同事。
2️⃣ Codex SDK:无缝嵌入工作流
只需几行代码,即可在工具或应用中集成Codex。
目前支持TypeScript,更多语言即将到来。
无论在本地终端、云端环境还是CI/CD管线中,Codex都能实现无缝协作。
3️⃣ 管理功能升级:提升安全性与可控性
ChatGPT工作区管理员现在可以管理Codex环境(编辑、删除)、设置默认安全策略,并实时监控使用数据与代码质量。
全新的仪表盘使团队的AI协作更为透明化与可追踪。
📈 使用方式与定价
✅ Slack集成 & Codex SDK
现已向ChatGPT Plus / Pro / Business / Edu / Enterprise用户开放。
✅ 新的管理员功能
面向Business / Edu / Enterprise计划开放。
自10月20日起,Codex云端任务将开始计入使用量,详细定价信息请参考OpenAI官方说明。
四、支持的多模态模型API
1、Sora 2 API
开发者现在可通过API集成最新的Sora 2模型,将视频生成能力引入其应用程序。
AI终于实现了“视频创作”的能力。
OpenAI最新发布的Sora API,使开发者仅需一句自然语言描述,即可生成包含画面、动作及声音的完整视频。
🌌 Sora模型介绍
Sora是OpenAI最新的多模态视频生成模型,能够从文字或图片输入中生成高保真、富有节奏感并带音频的动态视频。
相较于以往的图像生成模型,Sora对3D空间感、光影效果、运动轨迹与场景连续性均展现出更深层次的理解。
⚙️ 视频API开放:五大核心能力集成
现在,开发者可以直接通过API调用这些功能:
1️⃣ 创建视频:输入prompt,启动视频生成任务
2️⃣ 获取状态:查看生成进度、排队状态
3️⃣ 下载视频:渲染完成后获取MP4文件
4️⃣ 列出视频:管理项目历史与素材库
5️⃣ 删除视频:清理无用素材
Sora API支持全流程自动化与可编程,无论开发App、内容平台、短视频工具,抑或广告生成引擎,Sora均能成为其核心的“AI导演”。
🧠 两款模型开放:速度版与电影版
| 模型 | 特点 | 适合场景 |
|---|---|---|
| 🎞️Sora 2 | 快速生成、灵活迭代 | 概念草图、社交视频、内容原型 |
| 🎬Sora 2 Pro | 高质量输出、细节丰富 | 影视级画面、品牌广告、营销素材 |
Sora 2适合快速原型制作,而Sora 2 Pro则适用于高质量影视级内容创作。
未来,品牌广告、短片、教育内容、游戏预告及动画草图等多种形式的创作,均可能从一行文字描述开始。
2、GPT-5 Pro API
若认为GPT-5已足够强大,GPT-5 Pro将重新定义智能模型的能力边界。它不仅能够回答问题,更具备深度“思考”的能力。
GPT-5 Pro的特点在于其更深度推理能力、更稳定输出表现及超长上下文处理能力。
⚡️ GPT-5 Pro核心特性:
- 🔹 运用更强的算力,使模型在生成回答前进行更长时间的深度思考;
- 🔹 能够进行多轮推理、复杂逻辑分析及跨文档理解;
- 🔹 支持长达40万的上下文窗口;
- 🔹 输出上限高达27.2万tokens;
- 🔹 知识截止日期:2024年9月30日。
🧩 GPT-5 Pro独特之处:
✨ 专为高推理任务设计
GPT-5 Pro默认开启最高级别的推理模式(reasoning.effort: high),确保每一个回答都经过更深层的逻辑演算与验证。
🚫 不支持代码解释器
它并非专注于代码生成,而是作为一款智囊模型,擅长分析论文、规划商业方案以及审视复杂系统。
⚙️ 仅在Responses API中提供
为支持多轮模型交互、背景模式执行等高级功能。
💵 定价信息:
GPT-5 Pro尤其适用于需要深度分析且涉及大量输入与超长输出的任务。
| 模型 | 输入(/ 1M tokens) | 输出(/ 1M tokens) |
|---|---|---|
| GPT-5 Pro | 💲15.00 | 💲120.00 |
| o3-Pro | 💲20.00 | 💲— |
| GPT-5 | 💲1.25 | 💲— |
详情可访问:platform.openai.com/docs/models/gpt-5-pro
3、gpt-realtime-mini
对于追求低成本实时AI对话的用户而言,gpt-realtime-mini是不可错过的选择。

作为GPT Realtime的轻量级版本,它支持在WebRTC、WebSocket及SIP协议上轻松实现音频和文字的实时交互。
详情可访问:platform.openai.com/docs/models/gpt-realtime-mini
4、gpt-image-1-mini
gpt-image-1-mini能够满足用户对AI快速生成图片且控制成本的需求!

💡 应用场景:
gpt-image-1-mini特别适用于原型设计、快速概念生成及低成本项目测试。
详情可访问:platform.openai.com/docs/models/gpt-image-1-mini
写在最后
未来AI发展前景广阔,并日益趋向于应用落地。
AI技术的快速发展,对缺乏技术壁垒的创新者构成了挑战,此类创新终将成为时代的尘埃。
未来的发展路径尚无定论,或许应用创新值得探索。
