前途科技
  • 科技
  • AI
    • AI 前沿技术
    • Agent生态
    • AI应用场景
    • AI 行业应用
  • 初创
  • 报告
  • 学习中心
    • 编程与工具
    • 数据科学与工程
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
AI 前沿技术

OpenAI 2025开发者日重磅发布:ChatGPT变身操作系统,AgentKit赋能8分钟拖拽构建复杂AI Agent

NEXTECH
Last updated: 2025年10月7日 上午6:35
By NEXTECH
Share
40 Min Read
SHARE

OpenAI开发者日关键数据OpenAI 开发者日发布了震撼消息,其开发者数量已达惊人的400万,ChatGPT周活跃用户达到8亿,每分钟API处理的token量高达60亿。

OpenAI开发者日四大核心内容本次大会主要聚焦于以下四个方面:

  1. 在 ChatGPT 内部构建应用:Apps inside ChatGPT,OpenAI推出自己的Apps SDK。这被视为一项革命性进展,OpenAI旨在将ChatGPT转变为一个操作系统,颠覆现有应用生态。
  2. 直接拖拽构建Agent工具:AgentKit。发布了8分钟拖拽演示视频,展示了该工具的直观性。
  3. Codex更新,最新能力演示视频已发布。
  4. API支持:Sora 2,GPT-5 Pro。

ChatGPT成为操作系统愿景

Apps in ChatGPT:开启一个全新的应用分发与互动生态

此次发布被认为是OpenAI最具震撼性的战略举措,标志着ChatGPT正式进军操作系统领域。OpenAI的愿景是让ChatGPT成为用户唯一所需的超级应用,从而在实质上扮演操作系统的角色,这无疑给现有应用商店带来了巨大挑战。

过去,OpenAI通过GPTs和MCP等方式尝试连接开发者服务与ChatGPT,积累了宝贵经验。如今,OpenAI迈出决定性一步,正式向开发者开放ChatGPT,允许其在其中构建原生应用(Apps)。

这将催生新一代应用形态,具备互动性(interactive)、适应性(adaptive)和个性化(personalized)三大核心特质。用户将不再只是与聊天机器人对话,而是能直接在对话中与功能丰富的应用进行交互。为实现此目标,OpenAI推出了全新的Apps SDK(软件开发工具包),现已开放预览。

You Might Also Like

AI驱动支付提效40%:一键接入系统技术架构与大模型优化实践
Ring-1T:开源万亿思考模型,深度解析其训练与卓越性能
AI伦理警示:ChatGPT关联心理健康危机事件调查
AI效率提升10倍的秘密:掌握提示词工程“提问公式”,让AI成为你的高效同事

Apps SDK为开发者提供了一套完整的全栈解决方案,其主要特性包括:

  • 连接数据:开发者可无缝接入自己的数据源和后端服务。
  • 触发动作:应用能执行具体的后端操作,例如创建设计、预订行程或分析数据。
  • 渲染完整 UI:开发者可在ChatGPT对话流中渲染完全互动的用户界面,支持视频播放器、互动地图、设计画板等复杂UI直接嵌入。
  • 基于 MCP 标准:Apps SDK建立在MCP这一开放标准之上,开发者对后端逻辑和前端UI拥有完全控制权,且该标准公开,任何平台均可整合。

对开发者而言,最大的吸引力在于分发渠道。应用一旦构建完成,便有机会触达ChatGPT全球数亿用户群体,极大改变产品规模化扩展方式。同时,OpenAI也考虑了商业化需求。若用户已是开发者现有产品的订阅者,可直接在对话中登录账户。未来,OpenAI还将支持多种变现方式,包括新的Agentic Commerce Protocol(智能体商业协议),允许在ChatGPT内部实现即时结账。

在现场演示中,软件工程师Alexi展示了几个首批合作伙伴的应用,生动诠释了这种新模式的魅力:

  • Coursera(在线课程平台):用户可直接呼叫Coursera应用学习特定主题。应用在对话中嵌入课程视频,支持画中画或全屏播放。用户观看视频时,可随时向ChatGPT提问关于当前视频内容的问题,例如“请解释一下他们现在正在说的概念”。由于Apps SDK允许应用将上下文(context)暴露给模型,ChatGPT能准确理解用户正在观看的视频片段,并给出精准回答,将学习体验提升至全新高度。

    ChatGPT集成Coursera应用演示

  • Canva(设计平台):在为宠物狗遛弯业务进行头脑风暴的对话中,用户可直接呼叫Canva,用自然语言指令制作作品集,例如“Canva,用这个名字为我制作一个作品集,我希望它色彩丰富、异想天开、明亮,并使用无衬线字体”。Canva应用在对话中生成设计选项,用户可进一步迭代,将海报转化为融资简报。整个创意流程在同一对话窗口中无缝完成。

    ChatGPT集成Canva设计应用演示

  • Zillow(房地产平台):当对话涉及业务扩张并选择新城市匹兹堡时,用户可接着呼叫Zillow应用,要求“显示那里的待售房屋”。Zillow在对话中嵌入互动地图。用户可切换全屏模式,浏览房屋详情,甚至直接在地图上发起预约看房。用户还能继续用自然语言操作Zillow应用,例如“将地图筛选为仅显示带院子的三居室房屋”。ChatGPT理解指令并更新地图。此外,用户选定房产后,可询问“这处房产离狗狗公园有多远?”,ChatGPT会结合Zillow应用提供的房屋位置信息及其自身搜索工具,提供综合性答案。

    ChatGPT集成Zillow房地产应用演示

这些演示清晰表明,Apps in ChatGPT不仅是API的简单调用,更是将语言模型的理解能力与应用的丰富功能和互动界面深度融合,创造出前所未有的动态体验。

目前,Apps SDK已向开发者提供预览版。今年晚些时候,开发者将能提交应用进行审核和发布,届时还将推出一个应用目录(Directory)供用户浏览。符合基本标准的应用都将被收录,而那些在设计和功能上表现更出色的应用,将获得更显著的推荐位置,甚至在对话中被主动建议给用户。

https://developers.openai.com/apps-sdk

AgentKit:在几分钟内将智能体从原型带入生产环境

智能体(Agent),即能理解上下文、使用工具并自主完成任务的软件,被普遍认为是AI的下一个重要发展方向。然而,尽管相关讨论热烈,但真正能投入生产并被大规模使用的智能体却寥寥无几。其原因在于开发过程异常复杂,开发者需处理诸多难题:从选择合适框架,到编排复杂工作流、建立评估循环、连接各种工具,再到构建友好用户界面,每一步都充满挑战。

为解决这些痛点,让每位开发者能更快速地将想法转化为可用智能体,OpenAI推出了全新的AgentKit。这是一套内置于OpenAI平台中的完整构建模块,旨在帮助开发者以更少时间和精力,完成从原型设计到生产部署的全过程。

AgentKit核心包含三大组件,以及一个强大的连接器生态系统:

  • 1.Agent Builder(智能体构建器):这是一个可视化的工作流设计工具。开发者无需从头编写复杂协调代码,通过拖拽节点即可设计智能体逻辑步骤、测试流程。这些节点包括工具调用、人类介入环节、安全护栏和逻辑判断等。它建立在已有数十万开发者使用的Responses API之上,对平台老用户而言易于上手。

  • 2.ChatKit(聊天工具包):为使智能体拥有精美用户界面,OpenAI提供了ChatKit。它是一个简单、可嵌入的聊天界面组件,开发者可轻松集成到应用中,并进行品牌化定制(如修改颜色、Logo和提示语),从而专注于核心业务逻辑,无需在前端界面上耗费过多时间。

  • 3.Evals for Agents(智能体评估):衡量智能体性能至关重要。AgentKit提供了一套专门的评估功能,包括:

    • Trace Grading(追踪评分):逐一审视智能体每一步决策过程,深入理解其行为。
    • Datasets(数据集):允许针对工作流中特定节点进行性能评估。
    • Automated Prompt Optimization(自动化提示优化):帮助自动调整和改进提示词,以获得更好性能。
    • External Model Evals(外部模型评估):甚至支持在OpenAI Evals平台内直接对外部模型进行评估。
  • Connector Registry(连接器注册中心):智能体需要安全访问数据和工具。通过此管理控制面板,企业可安全地将智能体连接到内部工具和第三方系统,同时确保数据安全和权限可控。

现场演示中,Christina发起挑战:在8分钟内为DevDay官方网站构建并部署一个问答智能体“Ask Froge”。

相关视频已翻译并提供,便于读者直观理解。

设计工作流(在 Agent Builder 中):

1. 她首先拖入一个分类器节点,用于判断用户提问是关于“会议日程”还是“一般信息”。
2. 接着,她创建了两个专门的智能体节点。“日程智能体”上传了包含所有会议信息的文档作为知识源;“DevDay 通用智能体”提供了通用信息文件,并设定角色风格(像一只名为 Froge 的青蛙说话,会发出 "ribbit" 的声音)。
3. 为使日程推荐更具视觉吸引力,她使用 Widget Builder(小组件构建器) 设计了一个精美日程卡片,并将其附加到“日程智能体”的输出格式中。
4. 为增强安全性,她添加了一个预置的 Guardrail(护栏) 节点,用于自动屏蔽个人身份信息(PII)。
5. 整个工作流设计完成后,她在 Agent Builder 的预览窗口中进行了测试,确认其能正确回答问题并以预期方式呈现结果。

部署到网站:

1. 她点击“发布”,AgentKit 为这个工作流生成了一个唯一的 ID。
2. 然后,她来到 DevDay 网站的代码中,仅用几行代码就完成了部署:引入了 ChatKit 的 React 组件,将生成的工作流 ID 传入,并添加了一些自定义样式,如 Froge 主题颜色和提示语。
3. 刷新网站,一个名为 "Ask Froge" 的聊天机器人已出现在页面右下角,并完全可用。

整个过程从设计到部署,耗时不到8分钟。此演示完美展示了AgentKit如何将原本需要数周开发时间的复杂任务缩短到几分钟。更重要的是,后续迭代可直接在可视化的Agent Builder中完成,修改后的智能体无需重新部署代码即可在网站上生效。

Codex

Codex更新

今天,Codex正式结束研究预览,进入通用可用阶段。推出了一系列新功能:

  • Slack 集成:开发者可直接在Slack团队对话中要求Codex编写代码或回答问题。
  • Codex SDK:新的开发工具包,帮助团队将Codex能力扩展和自动化到自己的工作流中。
  • 新的管理工具和报告:包括环境控制、监控和分析仪表板,帮助企业更好地管理Codex使用。

现场演示中,Romain展示了如何利用Codex和OpenAI的API,将周围物理世界变为可交互软件。

相关演示视频全过程已提供。

从草图到 UI:Romain 首先展示了一张他手绘的 UI 草图,然后使用Codex CLI(命令行工具) 将其转换成一个带有摄像头画面的控制面板界面。
控制物理设备:他遇到的第一个挑战是发布会控制舞台上方的 Sony FR7 摄像机。Romain 对此一无所知,只知道该摄像机有一个 C++ SDK。他直接向 Codex 下达任务,Codex 自主研究了有 30 年历史的 VISCA 协议,并用 JavaScript 实现了控制逻辑。Romain 强调,Codex 能够不知疲倦地执行长达数小时的复杂任务。
实时添加新功能:接着,Romain 在 VS Code 中向 Codex 插件下达一个新任务:“将一个无线控制器连接起来以控制摄像机”。Codex 在后台开始分析现有代码,制定计划并实现功能。几分钟后,Romain 拿起一个 Xbox 手柄,成功控制了摄像机的移动。
多模态与多工具协作:演示高潮是引入语音控制。他利用 OpenAI 的实时语音 API 和 Agent SDK,为应用添加了语音交互能力。然后,他向 Codex 发出指令,要求为舞台的灯光系统创建一个 MCP 服务器,并提供了灯光系统的参考文档。Codex 在执行任务时,发现文档信息不全,于是自主上网搜索 GitHub 上的文档,补全了所需信息,最终成功创建了服务器。
人机协同编程的未来:演示最后,Romain 通过语音向应用下达指令:“让 Codex 显示一个类似电影结尾的演职员表,演员是现场的观众们”。应用中的语音智能体将此请求转发给了 Codex SDK。Codex 实时分析了前端应用的代码,注入了新的 React 组件,并在屏幕上滚动显示出演职员表。

此现场演示展示了Codex开发全过程:从草图、物理设备、语音指令到实时应用重构,整个过程几乎没有手写一行代码。Codex真正成为了一位能理解意图、解决未知问题并与开发者并肩工作的智能队友。

模型与 API 更新

  • GPT-5 Pro API 开放
  • GPT-Realtime-Mini API 开放
  • Sora 2 API 预览版发布

写在最后

DevDay 2025的所有发布都指向一个共同目标:OpenAI致力于为新的开发者时代提供最佳平台。从在ChatGPT内部分发应用的Apps SDK,到简化智能体开发的AgentKit,再到Codex,以及GPT-5 Pro、Sora 2和Realtime-Mini等更强大的模型API,OpenAI正在全方位赋能开发者。

Sam Altman表示,软件开发曾是需要数月甚至数年才能完成的漫长过程,但如今,其可在几分钟内完成。在这个新时代,开发者所需的仅仅是一个好的想法。

这是一个属于所有新开发者的黄金时代。开发者需要思考是否已做好准备,迎接这一新时代。

TAGGED:AI前沿技术ChatGPTOpenAI开发者日智能体
Share This Article
Email Copy Link Print
Previous Article 谷歌重磅推出AI漏洞赏金计划:最高奖金3万美元,全球白帽黑客共筑AI安全防线
Next Article Claude Agent SDK 智能体反馈循环示意图 Anthropic发布Claude Agent SDK:抢先OpenAI,揭秘核心理念与功能
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
20251202135921634.jpg
英伟达20亿美元投资新思科技,AI芯片设计革命加速
科技
20251202130505639.jpg
乌克兰国家AI模型选定谷歌Gemma,打造主权人工智能
科技
20251202121525971.jpg
中国开源AI新突破:DeepSeek V3.2模型性能比肩GPT-5
科技
20251202112744609.jpg
马斯克预言:AI三年内解决美国债务危机,可信吗?
科技

相关内容

SKILL.md文件结构示意图:YAML前置元数据与Markdown正文指令
AI 前沿技术

Claude Skills:知识工程赋能AI Agent,实现通用模型向专业‘行家里手’的范式转变

2025年10月18日
RAG流程示意图
AI 前沿技术

RAG优化技巧:从Query改写到知识库优化,全面提升召回准确率

2025年10月28日
RAG Chunking 核心概念:块大小与重叠窗口示意图
AI 前沿技术

RAG分块策略实战:从原理到优化,提升大模型问答效果

2025年10月30日
ChatPPT MCP 2.0本地Stdio模式
AI 前沿技术

ChatPPT与魔搭社区合作,MCP 2.0重磅升级:全链路智能体服务及多模式开源

2025年11月7日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创
  • 学习中心

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏

Copyright © 2025 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号

前途科技
Username or Email Address
Password

Lost your password?

Not a member? Sign Up