Google 拥有业界最强大的 AI 基础设施,但内部研究人员却面临算力不足的困境。大规模云合同占用了大量 TPU 资源,导致多名核心科学家离职创业,而外部反而更容易获得计算资源。
Google 构建了业界最强大的 AI 基础设施——自研芯片、蓬勃发展的云业务,以及数十亿美元的竞争对手供应合同。但这种成功带来了内部矛盾:公司自己的研究人员却无法获得足够的机器时间。
彭博社周一报道称,Google DeepMind 的研究人员正在争夺计算资源,而这些资源同时被出售给外部客户。这一状况已迫使多位知名科学家离职,创办自己的公司。

结构性问题源于合同约束。Google 已承诺向 Anthropic 提供高达 400 亿美元的基础设施,包括五年内 5 吉瓦的 TPU 容量以及多达 100 万颗第七代 Ironwood 芯片。另一项协议覆盖了 Meta。这些承诺锁定了大量算力,内部模型团队需要排队才能使用。
DeepMind 首席执行官 Demis Hassabis 今年早些时候承认了这一压力,指出研究人员“需要大量芯片才能足够大规模地实验新想法”。硬件瓶颈部分由三星、美光和 SK 海力士的高带宽内存供应限制造成,这超出了 Google 的控制。但内部资源分配决策是可控的。
Andrew Dai 在 Google 工作 14 年,曾共同领导 Gemini 的数据工作并负责 PaLM 2 的预训练,于 2026 年 1 月离职,共同创立了多模态推理实验室 Elorian,融资 5500 万美元。Ioannis Antonoglou 是 DeepMind 的创始工程师之一,参与过 AlphaGo 和 MuZero 的开发,共同创立了 ReflectionAI,后者已融资 20 亿美元用于构建开放权重前沿模型。Anna Goldie 是 AlphaChip 的联合负责人和前 Gemini 研究员,于 2025 年底创立了 Ricursive Intelligence,估值 40 亿美元并融资 3 亿美元,专注于用 AI 设计芯片。
这三人都离开了在一个季度内资本支出近 140 亿美元的公司——但每个人都表示,在外面获得计算更容易。
艾伦人工智能研究所前所长 Oren Etzioni 描述这种现象为可预期的结果:内部市场按管理资历而非单位成本经济学来配给算力。Google 没有反驳彭博社的报道框架,而是指出其更广泛的基建投资,并强调算力约束是整个行业普遍存在的问题。
这没错——每个主要模型提供商相对于自身研究雄心都面临算力限制。但 Google 的独特之处在于其矛盾的现实:它已成为主要竞争对手最大的基础设施供应商,而自己的研究人员却在排队等待。
免费获取企业 AI 成熟度诊断报告,发现转型机会
关注公众号

扫码关注,获取最新 AI 资讯
3 步完成企业诊断,获取专属转型建议
已有 200+ 企业完成诊断