92%的企业在AI上大举投入,但95%的试点项目颗粒无收。问题不在模型能力,而在于集成层的一团乱麻——标准缺失、重复造轮子、安全漏洞丛生。只有拥抱开放协议、聚焦方法而非模型,才能让AI真正落地。

8分钟读完

2023年9月,我提交了一篇论文,探讨AI如何重塑咨询行业的认知生产力。那时ChatGPT才十个月大。我调研了整个行业,发现92%的公司已经在往AI里砸钱砸人。所有人都感觉得到,浪潮来了。
两年后,MIT公布了另一个数字。调研了300个企业部署、采访了150位高管,结果95%的生成式AI试点项目,对损益表没有产生任何可衡量的影响。投入三四百亿美元,几乎零产出。
几乎每家公司都投了。几乎每个试点都黄了。这两个数字,相隔三年,就是企业AI迄今为止的全部故事。
MIT的研究有人批评,标题比细节更扎眼。但细节才有趣——研究者明确指出了原因:不是模型质量不行。试点死在了模型与业务之间那层——那些在演示时惊艳全场、却记不住上下文、学不会反馈、接不上真实业务系统的工具。
与此同时,大约90%的员工已经在悄悄用消费级AI干活,不管公司允不允许。需求是真的。但技术栈是拦路虎。
我那篇论文问的是:模型够不够好?答案是够的。
我低估了模型之外的一切。我写了很多关于辅助工具、生产力和职业倦怠,把集成问题当成别人会搞定的细节。三年下来,一边搭建一边教学,我发现恰恰相反——模型是最小的问题,方法才是全局。
这种局面我们见过。上一次某个行业遇到一模一样的问题,烧了几千亿美元才找到答案。
1999年,所有人都知道互联网会改变商业,但没人知道怎么变。于是资本涌入了一千种自建答案,每条路都是私有的。Pets.com花重金在超级碗打广告,IPO融资8200万,九个月后就倒闭了。同类公司不胜枚举。
终结混乱的不是更好的网站,而是共识——而且大部分是免费的。
1993年,Tim Berners-Lee说服CERN免费发布网页标准。次年W3C成立,防止HTML和HTTP分裂成各种私有版本。底层还有TCP/IP,不华丽但通用。一旦“怎么做”定下来,在网页上搭建就不再是发明,而是工程。价值不再浪费在重复劳动上,而是开始累积。
亚马逊赢下互联网泡沫,靠的不是私有的互联网,而是利用所有人都在用的开放标准,死磕执行。泡沫在2000年破裂,互联网继续积累价值。活下来的,是那些在标准上建设的企业,而不是试图成为标准的企业。
这个模式比互联网还古老。更早的版本更有教育意义,因为那是有形的成本。
1840年代,英国铁路有两种不兼容的铁轨宽度。布鲁内尔的大西铁路用宽轨,其他人用斯蒂芬森的标准轨。两轨相接的车站,比如格洛斯特,所有乘客必须下车换乘:行李丢失、货物损坏、时间浪费——因为两种工程文化无法就铁轨间距达成一致。最终议会不得不用立法强制统一。
这就是没有标准要付出的代价。不是戏剧性的灾难,而是摩擦——无数笔隐形小税,在两个系统相接的每个边界上征收。
标准就是取消这种税。标准甚至不需要是最优的。Betamax理论上更好,但输给了VHS——因为生态选择了同一条路,而生态才是关键。
如今,大多数大型组织的AI技术栈长这样:顶层是OpenAI、Anthropic和谷歌的先进模型,底层是装满有价值数据的业务系统。中间是一层手搓的胶水:东拼西凑的检索管道、未经审计的连接器,还有那些用略微不同、文档不全的方式解决了同一个集成问题的试点项目。
95%的失败就死在这一层。安全风险也集中在这里。每个自建连接器都是未经过充分检查的攻击面——团队在截止日期压力下仓促搭建,还没来得及让上一个功能变安全,就追逐下一个功能了。光鲜的玩意儿不仅浪费钱,还在积攒风险。
Fred Brooks在1986年就说过:没有银弹。没有哪项技术能独自带来量级提升。谁要是兜售这种东西,卖给你的就是下个季度就会夭折的试点项目。在AI工程中,模型只是大系统图中的一个盒子,而更大的系统图才是产品。
2024年11月,Anthropic发布了MCP(模型上下文协议),一个用于连接AI系统与工具和数据的开放标准。一个通用的插头,让每个团队不用再自己焊接了。四个月后,OpenAI直接采纳了竞争对手的这个协议。Google、Microsoft和AWS也跟进了。2025年12月,Anthropic将其捐赠给Linux基金会下的一个基金会——Kubernetes的托管方,与OpenAI和Block合作共同建立。
HTTP用了整个90年代才达到这种跨厂商的共识。MCP只用了16个月——因为房间里每个人都经历过反面教材。
看看协议稳定后发生了什么。没人再争论怎么把模型连到数据库了。精力往上移动,到了你用这个连接能做什么上面。这就是标准的作用:不是限制创新,而是把创新迁移到有价值的地方。
但协议不是方法。MCP规范了“线”,没规范你怎么决定建什么、怎么评估效果、怎么应对失败、怎么处理代理做了你没预料到的事。那一层——开发方法、参考架构、评估纪律——仍然在每家公司各自重新发明。
我最常被问到的问题不是“它怎么工作”,而是“我们到底该建什么”。这个问题还没有标准答案,诚实回答令人不安:在组织能说清买什么结果、怎么衡量它之前,它不是在做AI项目,只是在攒试点项目。
对能力的诚实讨论也很重要。这些系统在某些方面极其出色,在其他方面则自信地犯错。大多数团队不愿意公开说出后一半,于是继续批那些基于市场营销而非技术设计的项目。建造方和购买方之间的透明度,是判断你是在创造价值、还是在重复发明别人已标准化了的轮子的唯一方式。
而在方法层停滞不前时,底下的地面正在移动。
智能正在变便宜,并向边缘迁移。
开放权重模型——你可以下载并在自己硬件上运行的开源模型——现在能在40亿到80亿参数范围内完成真正的日常工作:摘要、起草、基于自有数据的检索。不是前沿工作,而是构成组织大多数需求的常规负载。而且它们运行在你已有的机器上。当初把计算从大型机推送到PC、再到手机的那股力量,现在正在把推理推出数据中心、推到设备上。
对企业来说,这重新定义了成本讨论。并非每个工作负载都需要通过API调用前沿模型。相当一部分常规工作可以用小模型跑在你控制的基础设施上,这意味着可预测的成本,而不是按量计费的单子——而且敏感数据永远不会离开公司。这最后一点悄悄瓦解了困扰试点项目在受监管环境中一半的治理理由。把前沿模型留给真正需要前沿推理的工作。其余的路由到本地。
对个人来说,含义更个人化。重要的工具不再被订阅制和他人服务条款所阻挡。私有、本地、免费,现在是真实的配置,而不是爱好者的妥协。
让任何一种版本工作起来的纪律,正是本文所呼吁的:挑选一小套核心工具,认真学习,而不是追逐每一个新发布。掌握一个本地模型、一个自动化层和一个标准协议的人,每次都能胜过那些打开四十个炒作标签页的人。光鲜效应向上向下都一样。
我知道本地版本管用,因为我自己就在用。
在家,一台旧机器的算力上跑着小型开放权重模型,处理聊天、摘要和基于自有知识的检索。一个本地编码代理处理项目。一个自动化层监视事件、管理基础设施。它们通过MCP互相通信——和企业级正在趋同的同一个开放协议。
算力账单就是电费。
快吗?不快。而这一限制恰是你所能得到的最好的AI教育。当你无法用前沿模型的蛮力智能来遮羞时,你才学到真正重要的东西:哪些任务真的需要大模型、检索质量如何改变一切、小模型如何失败以及如何围绕它设计。约束教会你架构。如果一个工作流能在九年前处理器上以每秒7个token的速度运行,它在生产环境会飞起来。
这个道理在每一个规模上都是一样的。一台使用开放模型、开放协议的十年的台式机,就是企业参考架构的微缩版。模型、检索、代理、自动化、监控。任何人都可以花一台二手办公电脑的成本来搭建它,而它教给你的东西可以直接转移到服务于数千用户的系统上。你不再需要一个实验室的预算来真正学习这个。你只需要一个空闲的周末,和愿意被正确的事情“无聊”的耐心。
缺失的那一层不是工程问题。工程师在允许时会自然趋向标准。车轮的重新发明是在别处被合理化的。
所以解决之道也在工程之上。采用开放标准,而不是容忍私有的“雪花”。要求参考架构,而不是英雄式搭建。为评估提供和开发一样的资金,因为无法衡量的能力就是你不愿正视的负债。
还有一个截止日期。《制高点》追踪上个世纪每个信息产业的相同循环:广播、电话、电影、电视。每个开始时开放而混乱,最终都被控制了瓶颈的某个参与者以自己的条件整合。开放阶段不会持久。如果企业在这个阶段建造“雪堆”而不是支持开放标准,标准化仍会发生——只是会由某个供应商以锁定付费的方式强加给你。
互联网泡沫的幸存者本能地理解了这一点。AI的赢家也会。
我的论文问的是AI会不会让我们更高效。错的问题,或者至少问早了。模型迟早会足够好。
协议层比任何人预期的更快稳定。算力已经在向运行成本最低的地方迁移,包括你空房间里的桌子。方法层仍然悬而未决,而每个月的等待,就有另外几十亿美元流入在启动前就已死去的试点项目和token中。
92%的组织在技术成熟之前就在投资。被营销驱动。95%的试点项目回报为零。这两个数字之间的差距不是技术差距。
模型是易事。共识才是产品。
免费获取企业 AI 成熟度诊断报告,发现转型机会
关注公众号

扫码关注,获取最新 AI 资讯
3 步完成企业诊断,获取专属转型建议
已有 200+ 企业完成诊断