在发布 AI 硬件之前,OpenAI 先把 ChatGPT 变成操作系统、支持 MCP
在OpenAI第三届开发者大会DevDay 2025上,OpenAI宣布ChatGPT将可以直接在对话界面调用第三方APP,正式切入Agent领域并支持MCP(多模态控制协议),同时推出了官方套件AgentKit。尽管此次大会并未发布AI硬件,但ChatGPT的这一升级预示着其正向“操作系统”演进。
首先,ChatGPT可以直接调用如Spotify、Canva、Zillow、Booking.com、Expedia、Figma、Coursera等APP,通过语音或文本指令对这些APP进行操作,无需额外打开网页或切换页面。

OpenAI创始人奥特曼指出,未来几周内还将更新“应用变现”方式。这意味着ChatGPT不再仅仅是一个“聊天工具”,而是已进化成为“操作系统”,未来用户只需在ChatGPT的聊天界面表达意图,即可完全交由AI驱动执行。
在Agent领域,目前Agent的落地和高效运行仍面临挑战,从基础代码构建到外部工具的连接,都存在诸多需要克服的障碍。
AgentKit是OpenAI平台上为开发者提供的套件,旨在帮助开发者构建、部署和优化Agent工作流程,将Agent从想法变为可执行工具。

官方在大会现场演示了如何在Agent Builder上快速搭建智能体,并快速构建编程和框架。随后在ChatKit中嵌入聊天工具,开发者可自定义UI和品牌风格。最后通过Evals进行运行程度检查,用户能评估各节点运行情况并获得优化建议。这表明,AgentKit已包含编程、设计、工具连接、运行测评等完整链路。

OpenAI的开发者在现场利用此套件,在8分钟内成功建立并部署了一个Agent到电脑网站上。
文章接下来将回顾MCP(多模态控制协议)的作用。MCP支持大模型应用程序与外部数据源和工具之间进行无缝集成。结合AI,MCP能使硬件设备实现AI自动查询资料、操控软件工具、多任务接力及记忆功能等一系列高级能力。

OpenAI在现场指出,GPT-5 Codex通过实时API集成,可接入任意MCP服务器。演示中,Codex被要求连接现场照明系统及MCP服务器,并成功通过语音指令控制摄像头和面灯。这一Demo展示了AI控制硬件设备的强大能力,令人印象深刻。

奥特曼还介绍了GPT-5 Pro、Sora 2、GPT Realtime Mini等工具,这些工具的推出将专业、视频、交互等功能的开发门槛大幅降低,使得唯一的限制变成了想象力。

