这篇文章最初发表在我们的 AI 周报《算法》中。要第一时间收到此类文章,请在此注册。
OpenAI 的产品主管 Olivier Godement 和开发者体验主管 Romain Huet 正在进行全球巡回演讲。上周,我在伦敦 DevDay(OpenAI 的年度开发者大会)之前与他们二人会面。伦敦的 DevDay 是 OpenAI 在旧金山以外举办的第一个开发者大会。Godement 和 Huet 接下来将前往新加坡。
OpenAI 最近几周一直非常忙碌。在伦敦,OpenAI 宣布了其新的实时 API 平台的更新,该平台允许开发者将语音功能集成到他们的应用程序中。OpenAI 正在推出新的语音和一个允许开发者生成提示的功能,这将使他们能够更快地构建应用程序和更实用的语音助手。与此同时,针对消费者,OpenAI 宣布推出 ChatGPT 搜索,允许用户使用聊天机器人搜索互联网。了解更多信息。
这两个发展都为 AI 的下一个重大突破铺平了道路:智能体。智能体是能够完成复杂任务链的 AI 助手,例如预订航班。(你可以阅读我关于智能体的解释在这里)。
“快进几年——地球上的每个人,每个企业,都将拥有一个智能体。这个智能体非常了解你。它知道你的偏好,”Godement 说。这个智能体将能够访问你的电子邮件、应用程序和日历,并像你的首席幕僚一样,与这些工具进行交互,甚至处理长期问题,例如撰写关于特定主题的论文,他说。
Godement 说,OpenAI 的策略是既要自己构建智能体,又要允许开发者使用其软件构建自己的智能体。语音将在智能体的外观和感觉方面发挥重要作用。
“目前大多数应用程序都是基于聊天的……这很酷,但不适合所有用例。在某些用例中,你不会打字,甚至不会看屏幕,因此语音对于这些用例来说是一种更好的模式,”他说。
但是,Godement 说,在智能体成为现实之前,有两个主要障碍需要克服。
第一个是推理。Huet 说,构建 AI 智能体需要我们能够相信它们能够完成复杂的任务并做出正确的决定。这就是 OpenAI 的“推理”功能发挥作用的地方。OpenAI 的 o1 模型上个月推出了“推理”功能,它使用强化学习来教模型如何使用“思维链”处理信息。Godement 说,给模型更多时间生成答案,可以让它识别并纠正错误,将问题分解成更小的部分,并尝试不同的方法来回答问题。
但是,华盛顿大学计算机科学教授 Chirag Shah 说,OpenAI 关于推理的说法应该持保留态度。大型语言模型并没有表现出真正的推理能力。它们很可能从训练数据中学习了类似逻辑的东西。
“这些模型有时似乎在推理方面非常出色,但它们只是擅长伪装,只要稍微挑剔一下,就会发现它们的破绽,”他说。
Godement 承认,还有很多工作要做。短期内,像 o1 这样的 AI 模型需要更加可靠、更快、更便宜。从长远来看,OpenAI 需要将其思维链技术应用于更广泛的用例。OpenAI 一直专注于科学、编码和数学。现在,它希望解决其他领域,例如法律、会计和经济学,他说。
待办事项清单上的第二项是连接不同工具的能力,Godement 说。如果 AI 模型只能依赖其训练数据,那么它的能力将受到限制。它需要能够浏览网页并寻找最新的信息。ChatGPT 搜索是 OpenAI 的新工具现在能够做到这一点的一种强大方式。
这些工具不仅需要能够检索信息,还需要能够在现实世界中采取行动。竞争对手 Anthropic 宣布了一项新功能,其 Claude 聊天机器人可以通过与计算机界面交互来“使用”计算机,例如点击某些东西。对于智能体来说,这是一个重要的功能,如果它们要能够执行预订航班等任务,就需要具备这个功能。Godement 说,o1 可以“某种程度上”使用工具,尽管不太可靠,并且工具使用方面的研究是一个“很有希望的发展”。
Godement 说,在未来一年,他预计 AI 在客户支持和其他基于助手的任务中的应用将增长。然而,他说,很难预测人们将如何采用和使用 OpenAI 的技术。
“坦率地说,回顾过去每一年,我都对一些我从未预料到的用例感到惊讶,”他说。“我预计会有很多我们无法预测的惊喜。”
现在阅读《算法》的其余部分
深度学习
这个 AI 生成的 Minecraft 版本可能代表了实时视频生成的未来
当你漫步在 AI 公司 Decart 和 Etched 生成的 Minecraft 版本中时,你会感觉有点奇怪。当然,你可以像在真实游戏中一样向前移动、砍伐树木并放置泥土方块。但是,如果你转过身,你刚刚放置的泥土方块可能会变成一个全新的环境。这在 Minecraft 中不会发生。但这个新版本完全是 AI 生成的,因此它容易产生幻觉。没有编写一行代码。
准备就绪,开始:这个 Minecraft 版本是使用称为下一帧预测的技术实时生成的。该 AI 公司通过在其模型 Oasis 上训练数百万小时的 Minecraft 游戏玩法和用户在游戏中采取的相应操作的记录来实现这一点。AI 能够仅从这些数据中整理出 Minecraft 的物理、环境和控制。
比特与字节
AI 搜索可能会破坏网络在最好的情况下,AI 搜索可以更好地推断用户的意图,放大高质量内容,并从各种来源综合信息。但如果 AI 搜索成为我们访问网络的主要入口,它将威胁到已经岌岌可危的数字经济,哈佛大学伯克曼·克莱因中心的学者 Benjamin Brooks 认为,他曾领导 Stability AI 的公共政策工作。(麻省理工学院科技评论)
AI 将加剧电子垃圾问题。我们可以做些什么?到 2030 年,用于训练和运行生成式 AI 模型的设备可能会产生高达 500 万吨的电子垃圾,这占全球总量的比例相对较小,但仍然是一个重要的数字。(麻省理工学院科技评论)
如何用一位已故伟人的“采访”揭露 AI 的弊端波兰一家由国家资助的广播电台解雇了其播音员,并引入了 AI 生成的播音员。但这场实验引发了强烈抗议,并在其中一位播音员“采访”了一位已故诺贝尔奖获得者后停止了。(纽约时报)
Meta 表示,请随意使用更多 AI 生成的垃圾在 Meta 最近的财报电话会议上,首席执行官马克·扎克伯格表示,我们可能会看到“一类全新的内容,即 AI 生成的内容或 AI 总结的内容,或者由 AI 以某种方式整合在一起的现有内容”。扎克伯格补充说,他认为“这将非常令人兴奋”。(404 媒体)