“`html

中国AI数据中心:泡沫破裂后的沉思
一年前,李霄的微信朋友圈充斥着英伟达芯片交易的信息。这位曾经的房地产承包商转型成为数据中心项目经理,2023年投身AI基础设施建设,看中了中国AI热潮的巨大潜力。当时,他圈内的交易者们炫耀着他们如何绕过美国出口限制,通过海外渠道将高性能英伟达GPU运到深圳。在需求高峰期,一块对AI模型训练至关重要的英伟达H100芯片,黑市价格高达20万元人民币(约合28000美元)。
如今,他的微信和行业群却呈现出截然不同的景象。交易者们变得更加谨慎,价格也回归理性。与此同时,李霄了解的两个数据中心项目正苦于难以获得进一步融资,投资者预期回报不佳,项目负责人不得不抛售剩余的GPU。“现在是卖方市场,却鲜有买家问津,”他说。
几个月前,由政府和私人投资者推动的中国数据中心建设热潮达到顶峰。然而,许多新建成的设施如今却空置着。据《麻省理工科技评论》采访的业内人士(包括承包商、GPU服务器公司高管和项目经理)透露,大多数运营这些数据中心的公司都在苦苦挣扎。国内媒体《甲子光年》和《36氪》报道称,中国新建的计算资源高达80%处于闲置状态。
将GPU租给需要进行AI模型训练的公司,曾被视为新一波数据中心的主要商业模式,稳赚不赔。但随着DeepSeek的崛起以及AI经济学的突然变化,这一行业正摇摇欲坠。
兰德公司技术高级顾问吉米·古德里奇表示:“中国AI产业正在经历的阵痛,很大程度上是由于缺乏经验的企业和地方政府盲目跟风,建设的设施无法满足当前需求。”项目失败、能源浪费,数据中心已成为投资者急于以低于市场价抛售的“不良资产”。他预测,这种情况最终可能促使政府干预:“中国政府可能会介入,接管这些项目,并将其交给更有能力的运营商。”
狂热的建设热潮与现实的落差
2022年末,ChatGPT横空出世,中国迅速做出反应。中央政府将AI基础设施建设列为国家重点,敦促地方政府加快所谓的“智能计算中心”(一种专门针对AI的数据中心)的建设。
据市场研究公司KZ Consulting的数据,2023年和2024年,从内蒙古到广东,宣布启动了500多个新的数据中心项目。中国通信产业协会数据中心委员会(一个国家支持的行业协会)的数据显示,截至2024年底,至少有150个新建数据中心建成并投入运行。国有企业、上市公司和国有基金纷纷投资,希望成为AI领域的领跑者。地方政府大力推广这些项目,希望能够刺激经济,并将本地区打造成为重要的AI中心。
然而,随着这些昂贵的建设项目持续进行,中国对大型语言模型的狂热正在消退。仅在2024年,就有超过144家公司向国家互联网监管机构——国家互联网信息办公室注册,开发自己的LLM。然而,《经济观察报》报道称,到年底,只有约10%的公司仍在积极投资大型模型的训练。
中国政治体制高度集中,地方政府官员通常通过地区任命晋升。因此,许多地方领导人更重视能够迅速见效的短期经济项目——通常是为了获得上级的青睐——而不是长远发展。大型、引人注目的基础设施项目长期以来一直是地方官员提升政治生涯的工具。
疫情后的经济低迷加剧了这种局面。随着中国房地产行业——曾经是地方经济的支柱——几十年来首次陷入低迷,官员们争先恐后地寻找替代性的增长动力。与此同时,中国曾经蓬勃发展的互联网行业也进入了停滞期。在这种情况下,AI基础设施成为了新的刺激政策选择。
“AI就像一针强心剂,”李霄说,“过去流入房地产的大量资金现在正涌入AI数据中心。”
到2023年,许多缺乏AI经验的大型公司开始与地方政府合作,利用这一趋势。北京的一位数据中心项目经理方存宝表示,一些公司将AI基础设施视为证明业务扩张或提升股价的一种方式。其中包括味精制造商莲花集团和纺织公司金轮科技——这些公司与尖端的AI技术几乎毫无关联。
方存宝、李霄和多位不愿透露姓名的知情人士(他们担心政治报复)表示,这种淘金式的做法意味着,AI数据中心的建设很大程度上是由上而下推动的,往往很少考虑实际需求或技术可行性。许多项目是由缺乏AI基础设施专业知识的高管和投资者领导的。为了赶进度,许多项目建设仓促,达不到行业标准。
古德里奇说:“将所有这些大型芯片集群整合在一起是一项非常困难的工作,能够大规模完成这项工作的公司或个人寥寥无几。这完全是顶尖的计算机工程技术。如果大多数小型参与者知道如何做到这一点,我会感到惊讶。许多新建成的数据中心都是仓促搭建的,无法提供DeepSeek等公司所需的稳定性。”
更糟糕的是,项目负责人经常依赖中间人和经纪人——其中一些人夸大需求预测或操纵采购流程以赚取政府补贴。到2024年底,曾经围绕中国数据中心热潮的兴奋情绪已经变成了失望。原因很简单:GPU租赁不再是一项特别有利可图的业务。
DeepSeek效应:算力过剩与芯片短缺的悖论
数据中心的商业模式理论上很简单:通过将GPU集群租给需要AI训练计算能力的公司来赚钱。然而,实际上,寻找客户却证明非常困难。目前,只有少数中国顶级科技公司正在大量利用计算能力来训练他们的AI模型。自DeepSeek推出其开源推理模型R1以来,许多小型公司已经放弃了预训练模型或改变了策略,R1的性能与ChatGPT o1相当,但成本却低得多。
埃默里大学信息系统助理教授曹恒成表示:“DeepSeek是给中国AI产业敲响的警钟。关键问题已经从‘谁能做出最好的大型语言模型’转变为‘谁能更好地利用它们’。”
像DeepSeek的R1和OpenAI的ChatGPT o1和o3这样的推理模型的兴起,也改变了企业对数据中心的期望。使用这项技术,大部分计算需求来自对用户查询进行逐步逻辑推演,而不是训练和创建模型本身。这种推理过程通常会产生更好的结果,但需要更多时间。因此,低延迟(数据在一个网络上的一个点到另一个点之间传递所需的时间)的硬件至关重要。数据中心需要靠近主要的科技中心,以最大限度地减少传输延迟,并确保获得高技能的运营和维护人员。
这种变化意味着许多建在华中、西部和农村地区的数据中心(电力和土地成本较低)对AI公司失去了吸引力。在李霄家乡河南省的郑州市,一个新建成的数据中心甚至向当地科技公司发放免费计算券,但仍然难以吸引客户。
此外,近年来涌现的大量新数据中心是针对预训练工作负载(在海量数据集上运行的大型、持续计算)进行优化的,而不是针对推理(实时运行训练好的推理模型以响应用户输入)进行优化的。支持推理的硬件与传统上用于大规模AI训练的硬件不同。
英伟达H100和A100等GPU专为海量数据处理而设计,优先考虑速度和内存容量。但随着AI转向实时推理,该行业正在寻求更高效、更快速且更具成本效益的芯片。即使是基础设施需求的微小误判,也可能使数据中心无法胜任客户所需的任务。
在这种情况下,GPU租赁价格跌至历史低点。中国媒体《智涌先锋》最近的一份报告称,配置了8个GPU的英伟达H100服务器目前的月租金为7.5万元人民币,而最高时曾达到18万元左右。方存宝说,一些数据中心宁愿让设施空置,也不愿冒着亏损更大的风险,因为运营成本非常高:“少量数据中心的运行收入根本无法覆盖电力和维护成本。”
李霄说:“这很矛盾——中国购买英伟达芯片的成本最高,但GPU租赁价格却极低。”计算能力过剩,尤其是在中国中西部地区,但与此同时,尖端芯片却短缺。
然而,并非所有经纪人都打算从数据中心赚钱。相反,许多人一开始就对政府补贴感兴趣。据方存宝和一些中国媒体报道,一些运营商利用补贴的绿色电力,获得发电和售电许可证。他们并没有将电力用于AI工作负载,而是以更高的价格将其再售回电网。据当地媒体《甲子光年》报道,在其他情况下,公司获得数据中心开发用地是为了获得国家支持的贷款和信贷,设施闲置的同时仍然受益于国家资金。
方存宝说:“到2024年底,市场上没有哪个头脑清醒的承包商和经纪人还会指望直接盈利。我遇到的每个人都在利用数据中心项目来获取政府的其他优惠政策。”
必要的“阵痛”
尽管数据中心利用率不足,但中国中央政府仍在大力推动AI基础设施建设。2025年初,政府召开了AI产业研讨会,强调在该技术领域实现自给自足的重要性。
中国主要科技公司正在密切关注这一动向,并进行与国家战略相符的投资。阿里巴巴集团宣布计划在未来三年内投资超过500亿美元用于云计算和AI硬件基础设施,而字节跳动计划投资约200亿美元用于GPU和数据中心。
与此同时,美国公司也在做同样的事情。包括OpenAI、软银和甲骨文在内的大型科技公司已联手承诺参与“星门计划”(Stargate initiative),计划在未来四年内投资高达5000亿美元用于建设先进的数据中心和计算基础设施。鉴于两国之间的AI竞争,专家表示,中国不太可能缩减其努力。“如果生成式AI将成为杀手级技术,那么基础设施将决定成败,”兰德公司的技术政策顾问古德里奇说。
古德里奇说:“中国中央政府可能会将(未充分利用的数据中心)视为发展重要能力的必要‘阵痛’。会有失败的项目和不良资产,国家会进行整合和清理。他们看到的是最终目标,而不是实现目标的过程。”
对英伟达芯片,尤其是为中国市场定制的H20芯片的需求依然强劲。一位不愿透露姓名的业内人士证实,H20是一款更轻、更快的针对AI推理优化的型号,目前是最受欢迎的英伟达芯片,其次是H100,尽管美国对H100的销售受到官方限制,但它仍在源源不断地流入中国。部分新的需求来自部署自己版本的DeepSeek开源模型的公司。
目前,中国的许多数据中心都处于停滞状态——为一个尚未到来的未来而建。它们能否找到新的用途仍然不确定。对方存宝来说,DeepSeek的成功成为一个反思的时刻,让人质疑无限扩张AI基础设施就能保证进步的假设。
他意识到,这只是一个神话。今年年初,方存宝决定彻底退出数据中心行业。“市场太混乱了。早期采用者获利了,但现在只是人们在追逐政策漏洞,”他说。他决定转行从事AI教育。
他说:“现在和AI真正无处不在的未来之间,不再是基础设施,而是部署这项技术的切实可行的计划。”
“`
