订阅我们的每日和每周新闻通讯,获取有关行业领先人工智能报道的最新更新和独家内容。了解更多
OpenAI 的首席研究科学家 Noam Brown 在旧金山举行的 TED 人工智能大会上发表了关于人工智能未来的精彩演讲,重点介绍了 OpenAI 的新 o1 模型及其通过战略推理、高级编码和科学研究改变行业的潜力。Brown 曾领导过人工智能系统 Libratus(一款会玩扑克的人工智能)和 CICERO(一款精通外交游戏的 AI)的突破性进展,如今他展望了一个未来,在这个未来,人工智能不仅仅是一种工具,而是各个领域创新和决策的核心引擎。
“过去五年人工智能取得的惊人进步可以用一个词概括:规模,”Brown 对着台下充满开发人员、投资者和行业领袖的观众说道。“是的,也有一些突破性的进展,但如今的尖端模型仍然基于 2017 年推出的相同 Transformer 架构。主要区别在于用于训练模型的数据规模和计算能力。”
作为 OpenAI 研究工作的核心人物,Brown 迅速强调,虽然模型的规模是人工智能取得进步的关键因素,但现在是时候进行范式转变了。他指出,人工智能需要超越单纯的数据处理,进入他称之为“系统二思维”的领域——一种更慢、更谨慎的推理形式,类似于人类解决复杂问题的方式。
为了强调这一点,Brown 分享了他博士期间在 Libratus(一款在 2017 年击败顶级人类玩家的扑克人工智能)项目上的经历。
“事实证明,让机器人在一局扑克中思考 20 秒,就能获得与将模型规模扩大 10 万倍并训练 10 万倍更长时间相同的性能提升,”Brown 说。“当我得到这个结果时,我简直以为是程序错误。在我博士生涯的前三年,我设法将这些模型的规模扩大了 100 倍。我为这项工作感到自豪。我写过很多关于如何进行这种扩展的论文,但我很快意识到,所有这些都将成为与扩展系统二思维相比的脚注。”
Brown 的演讲将系统二思维介绍为传统扩展方法局限性的解决方案。心理学家丹尼尔·卡尼曼在其著作《思考,快与慢》中普及了系统二思维,它指的是人类用于解决复杂问题的更慢、更谨慎的思维模式。Brown 认为,将这种方法融入人工智能模型可以带来重大的性能提升,而无需指数级地增加数据或计算能力。
他回忆说,让 Libratus 在做出决策之前思考 20 秒产生了深远的影响,相当于将模型的规模扩大了 10 万倍。“结果让我大吃一惊,”Brown 说,他用这个例子说明了企业如何通过专注于系统二思维,用更少的资源获得更好的结果。
Brown 的演讲紧随 OpenAI 发布 o1 系列模型之后,这些模型将系统二思维引入人工智能。这些模型于 2024 年 9 月推出,旨在比其前身更仔细地处理信息,使其成为科学研究、编码和战略决策等领域复杂任务的理想选择。
“我们不再局限于仅仅扩展系统一训练。现在我们也可以扩展系统二思维,而在这个方向上的扩展最美妙之处在于它基本上是未开发的,”Brown 解释道。“这不是一场 10 年后或 2 年后才会发生的革命。这是一场正在发生的革命。”
o1 模型已经在各种基准测试中展现出强大的性能。例如,在国际数学奥林匹克竞赛的资格考试中,o1 模型的准确率达到了 83%——比 OpenAI 的 GPT-4o 的 13% 有了显著提高。Brown 指出,o1 模型能够推理复杂的数学公式和科学数据,使其在依赖数据驱动决策的行业中特别有价值。
对于企业来说,OpenAI 的 o1 模型提供的益处超出了学术性能。Brown 强调,扩展系统二思维可以改善医疗保健、能源和金融等行业的决策过程。他以癌症治疗为例,问道:“请举手,如果你愿意为一种新的癌症治疗方法支付超过 1 美元的费用…… 1000 美元呢?一百万美元呢?”
Brown 建议,o1 模型可以帮助研究人员加快数据收集和分析,使他们能够专注于解释结果和生成新的假设。在能源领域,他指出,该模型可以加速更高效的太阳能电池板的开发,从而可能在可再生能源领域取得突破。
他承认人们对更慢的人工智能模型持怀疑态度。“当我向人们提及这一点时,我经常得到的回应是,人们可能不愿意等待几分钟才能得到回复,或者不愿意支付几美元才能得到问题的答案,”他说。但他认为,对于最重要的问题来说,这种成本是值得的。
OpenAI 向系统二思维的转变可能会重塑人工智能的竞争格局,尤其是在企业应用方面。虽然大多数当前模型都针对速度进行了优化,但 o1 背后的谨慎推理过程可以为企业提供更准确的见解,尤其是在金融和医疗保健等行业。
在科技领域,谷歌和 Meta 等公司正在大力投资人工智能,OpenAI 对深度推理的关注使其脱颖而出。例如,谷歌的 Gemini AI 针对多模态任务进行了优化,但它在解决问题的能力方面与 OpenAI 的模型相比如何,还有待观察。
尽管如此,实施 o1 的成本可能会限制其广泛采用。该模型比以前的版本运行速度更慢,成本也更高。有报道称,o1 预览模型的成本为每百万输入令牌 15 美元,每百万输出令牌 60 美元,远高于 GPT-4o。不过,对于需要高精度输出的企业来说,这项投资可能是值得的。
Brown 在结束演讲时强调,人工智能开发正处于一个关键的转折点:“现在我们有了新的参数,我们可以扩展系统二思维——而我们才刚刚开始在这个方向上扩展。”