订阅我们的每日和每周新闻通讯,获取有关行业领先的 AI 报道的最新更新和独家内容。了解更多
每周,甚至每天,都会有新的最先进的 AI 模型问世。随着我们迈入 2025 年,新模型发布的速度令人眼花缭乱,甚至让人感到疲惫。这趟过山车的曲线正在呈指数级增长,疲惫和惊奇已成为我们挥之不去的伴侣。每次发布都强调了为什么这个特定模型比其他所有模型都更好,无尽的基准测试和条形图充斥着我们的信息流,我们拼命地想要跟上。
自 2020 年以来,每年发布的大型基础模型数量一直在爆炸式增长Charlie Giattino、Edouard Mathieu、Veronika Samborska 和 Max Roser(2023 年)——“人工智能”在 OurWorldinData.org 上在线发布。
十八个月前,绝大多数开发人员和企业都在使用单一的 AI 模型。如今,情况恰恰相反。很少有规模较大的企业会将自己局限于单一模型的功能。企业对供应商锁定持谨慎态度,尤其是在这项技术迅速成为长期企业战略和短期利润收入的核心部分的情况下。团队将所有赌注押在一个大型语言模型 (LLM) 上,风险越来越大。
但尽管出现了这种碎片化,许多模型提供商仍然坚信 AI 将是一个赢家通吃的市场。他们声称,训练一流模型所需的专业知识和计算能力是稀缺的、可防御的,并且具有自我强化性。从他们的角度来看,构建 AI 模型的炒作泡沫最终会破裂,留下一个单一的、巨大的通用人工智能 (AGI) 模型,它将用于任何事情。独家拥有这样一个模型意味着成为世界上最强大的公司。这种奖品的规模引发了对更多 GPU 的军备竞赛,每隔几个月,训练参数的数量就会增加一个零。
《银河系漫游指南》中的巨型 AGI 深思BBC,《银河系漫游指南》,电视剧(1981 年)。为了评论目的而检索的静止图像。
我们认为这种观点是错误的。未来不会出现一个统治宇宙的单一模型,无论是在明年还是在未来十年。相反,AI 的未来将是多模型的。
《牛津经济学词典》将商品定义为“以规模化购买和出售的标准化商品,其单位是可以互换的”。语言模型在两个重要方面是商品:
- 模型本身在更广泛的任务集上变得更加可互换;
- 生产这些模型所需的科研专业知识正在变得更加分散和易于获取,前沿实验室几乎无法超越彼此,而开源社区中的独立研究人员紧随其后。
描述商品的商品(来源:Not Diamond)
但尽管语言模型正在商品化,但它们正在不均衡地进行商品化。存在一个庞大的核心能力集,对于这些能力集,任何模型,从 GPT-4 到 Mistral Small,都非常适合处理。与此同时,当我们走向边缘和极端情况时,我们看到了越来越大的差异化,一些模型提供商明确地专注于代码生成、推理、检索增强生成 (RAG) 或数学。这导致了无休止的纠结、Reddit 搜索、评估和微调,以找到适合每项工作的正确模型。
AI 模型围绕核心能力商品化,并在边缘专业化。来源:Not Diamond
因此,虽然语言模型是商品,但更准确地说,它们是模糊商品。对于许多用例,AI 模型将几乎可以互换,价格和延迟等指标将决定使用哪个模型。但在能力的边缘,情况将相反:模型将继续专业化,变得越来越差异化。例如,Deepseek-V2.5 在 C# 编码方面比 GPT-4o 更强大,尽管它的规模只有 GPT-4o 的一小部分,价格也便宜 50 倍。
这两种动态——商品化和专业化——推翻了单一模型最适合处理所有可能的用例的论点。相反,它们指向 AI 的一个日益碎片化的景观。
对于语言模型的市场动态,有一个恰当的类比:人脑。我们大脑的结构在 100,000 年内保持不变,大脑之间的相似性远大于差异。在我们在地球上的大部分时间里,大多数人学习相同的东西,并且拥有相似的能力。
但随后发生了一些变化。我们发展了用语言交流的能力——首先是口语,然后是书面语。通信协议促进了网络,随着人类开始相互连接,我们也开始在越来越大的程度上进行专业化。我们从需要在所有领域成为通才、成为自给自足的孤岛的负担中解放出来。矛盾的是,专业化的集体财富也意味着今天的人类比我们任何祖先都强大得多。
在足够大的输入空间上,宇宙总是倾向于专业化。从分子化学到生物学,再到人类社会,都是如此。在有足够的差异的情况下,分布式系统将始终比单体系统在计算上更有效率。我们相信 AI 也是如此。我们越能利用多个模型的优势,而不是依赖于单一模型,这些模型就能越专业化,从而扩展能力的前沿。
多模型系统可以实现更大的专业化、能力和效率。来源:Not Diamond
利用不同模型优势的一个越来越重要的模式是路由——动态地将查询发送到最合适的模型,同时在不降低质量的情况下利用更便宜、更快的模型。路由使我们能够利用专业化的所有优势——更高的准确性、更低的成本和延迟——而不会放弃任何泛化的稳健性。
路由能力的一个简单演示可以从以下事实中看出:世界上大多数顶级模型本身都是路由器:它们是使用专家混合架构构建的,将每个下一个令牌生成路由到几十个专家子模型。如果 LLM 确实是呈指数级增长的模糊商品,那么路由必须成为每个 AI 堆栈的重要组成部分。
有一种观点认为,LLM 在达到人类智能水平后将达到顶峰——随着我们完全饱和能力,我们将像围绕 AWS 或 iPhone 一样,围绕一个单一的通用模型凝聚起来。这两个平台(或其竞争对手)在过去几年中都没有将他们的能力提高 10 倍——因此我们不妨在他们的生态系统中感到舒适。然而,我们相信,AI 不会止步于人类智能水平;它将远远超出我们所能想象的任何限制。随着它的发展,它将变得越来越碎片化和专业化,就像任何其他自然系统一样。
我们不能过分强调 AI 模型碎片化是一件多么好的事情。碎片化的市场是高效的市场:它们赋予买方权力,最大限度地提高创新,并最大限度地降低成本。在我们可以利用更小、更专业模型的网络,而不是将所有内容都发送到单个巨型模型的内部的情况下,我们朝着 AI 的一个更安全、更可解释、更可控的未来迈进。
最伟大的发明没有所有者。本·富兰克林的继承人并不拥有电力。图灵的遗产并不拥有所有计算机。AI 无疑是人类最伟大的发明之一;我们相信它的未来将是——也应该是——多模型的。
Zack Kass 是OpenAI的前市场营销主管。
Tomás Hernando Kofman 是Not Diamond的联合创始人兼首席执行官。
DataDecisionMakers
欢迎来到 VentureBeat 社区!
DataDecisionMakers 是专家(包括从事数据工作的技术人员)分享数据相关见解和创新的地方。
如果您想了解前沿理念和最新信息、最佳实践以及数据和数据技术的未来,请加入我们,成为 DataDecisionMakers 的一员。
您甚至可以考虑
贡献您自己的文章
!
阅读 DataDecisionMakers 的更多内容