订阅我们的每日和每周新闻通讯,获取有关行业领先的 AI 报道的最新更新和独家内容。了解更多
人工智能叙事已达到一个关键的转折点。DeepSeek 的突破——在不依赖最先进芯片的情况下实现最先进的性能——证明了 12 月 NeurIPS 上许多人已经宣布的观点:人工智能的未来不在于向问题投入更多计算资源,而在于重新构想这些系统如何与人类和我们的环境协同工作。
作为一名斯坦福大学计算机科学专业的毕业生,我见证了人工智能发展的希望与风险,我认为这一刻比 ChatGPT 的首次亮相更具变革意义。我们正在进入一些人称之为“推理复兴”的时代。OpenAI 的 o1、DeepSeek 的 R1 以及其他模型正在超越蛮力扩展,朝着更智能的方向发展,并且以空前的效率实现这一目标。
这种转变来得正是时候。在 NeurIPS 的主题演讲中,前 OpenAI 首席科学家 Ilya Sutskever 宣称“预训练将结束”,因为虽然计算能力在不断增长,但我们受到有限互联网数据的限制。DeepSeek 的突破验证了这一观点——这家中国公司的研究人员以不到 OpenAI o1 成本的一小部分实现了可比的性能,证明了创新,而不仅仅是原始计算能力,才是前进的道路。
世界模型正在崛起,以填补这一空白。World Labs 最近筹集了 2.3 亿美元用于构建像人类一样理解现实的人工智能系统,这与 DeepSeek 的方法相呼应,他们的 R1 模型表现出“Aha!”时刻——就像人类一样停下来重新评估问题。这些受人类认知过程启发的系统有望彻底改变从环境建模到人机交互的一切。
我们正在看到早期成果:Meta 最近更新了他们的 Ray-Ban 智能眼镜,使人们能够与 AI 助手进行持续的、上下文相关的对话,而无需唤醒词,并提供实时翻译。这不仅仅是功能更新——它预示着人工智能如何在不依赖大型预训练模型的情况下增强人类能力。
然而,这种演变也带来了微妙的挑战。虽然 DeepSeek 通过创新的训练技术大幅降低了成本,但这种效率突破可能矛盾地导致整体资源消耗增加——这种现象被称为杰文斯悖论,即技术效率提高往往会导致资源使用增加而不是减少。
在人工智能领域,更便宜的训练可能意味着更多组织训练更多模型,从而可能导致净能源消耗增加。但 DeepSeek 的创新不同:他们证明了在没有尖端硬件的情况下也能实现最先进的性能,他们不仅使人工智能更高效,而且从根本上改变了我们进行模型开发的方式。
这种从原始计算能力转向巧妙架构的转变可能帮助我们摆脱杰文斯悖论的陷阱,因为重点从“我们能负担多少计算能力?”转变为“我们能以多高的智能设计我们的系统?”正如加州大学洛杉矶分校教授 Guy Van Den Broeck 指出,“语言模型推理的总成本肯定不会下降。”这些系统的环境影响仍然很大,推动着行业朝着更有效的解决方案发展——这正是 DeepSeek 所代表的创新。
这种转变需要新的方法。DeepSeek 的成功证明了未来不在于构建更大的模型,而在于构建更智能、更高效的模型,这些模型与人类智能和环境限制相协调。
Meta 的首席人工智能科学家 Yann LeCun 设想未来的系统会花几天甚至几周时间思考复杂的问题,就像人类一样。DeepSeek 的 R1 模型能够暂停并重新考虑方法,代表着朝着这一愿景迈出的一步。虽然资源密集型,但这种方法可能会在气候变化解决方案、医疗保健创新等领域取得突破。但正如卡内基梅隆大学的 Ameet Talwalkar 明智地提醒我们,我们必须质疑任何声称对这些技术将把我们引向何方抱有确定性的人。
对于企业领导者来说,这种转变为前进指明了一条清晰的道路。我们需要优先考虑高效的架构。一种可以:
- 部署专门的 AI 代理链,而不是单个大型模型。
- 投资于优化性能和环境影响的系统。
- 构建支持迭代的、以人为中心的开发的基础设施。
让我兴奋的是:DeepSeek 的突破证明了我们正在超越“越大越好”的时代,进入一个更加有趣的世界。随着预训练达到其极限,创新型公司正在找到用更少的资源实现更多目标的新方法,这为创造性的解决方案开辟了令人难以置信的空间。
更小、更专业的智能代理链不仅更高效,而且将帮助我们以我们从未想象过的方式解决问题。对于愿意跳出思维定势的初创企业和企业来说,这是我们再次享受人工智能的时刻,构建真正对人和地球都有意义的东西。
Kiara Nirghin 是一位屡获殊荣的斯坦福大学技术专家、畅销书作家和 Chima 的联合创始人。
DataDecisionMakers
欢迎来到 VentureBeat 社区!
DataDecisionMakers 是专家(包括从事数据工作的技术人员)分享数据相关见解和创新的平台。
如果您想了解前沿理念、最新信息、最佳实践以及数据和数据技术的未来,请加入我们 DataDecisionMakers。
您甚至可以考虑贡献自己的文章!
阅读 DataDecisionMakers 的更多内容