谷歌云与英伟达深化AI合作，发布分数GPU

技术2026年3月18日· 原作者：AccessPath 研究院· 3 分钟阅读1 阅读

在英伟达GTC 2026大会上，谷歌云与英伟达宣布扩展AI基础设施合作伙伴关系，推出分数G4虚拟机预览版，支持GPU按需付费，并计划在2026年下半年提供Vera Rubin NVL72系统。双方还整合了软件技术栈，加速AI模型部署，通用汽车等客户已采用相关服务。

Alphabet旗下的谷歌云与英伟达在加利福尼亚州圣何塞举行的英伟达GTC 2026大会上宣布，大幅扩展双方的AI基础设施合作伙伴关系。双方发布了新的硬件配置、软件集成以及下一代计算平台路线图，旨在为企业AI智能体工作负载提供支持。

谷歌云与英伟达合作图片

分数GPU和Vera Rubin即将推出

此次公告的核心是分数G4虚拟机的预览版，该虚拟机采用英伟达的虚拟GPU技术，将英伟达RTX Pro 6000 Blackwell Server Edition GPU切分为二分之一、四分之一和八分之一的增量——这在业界该级别GPU中尚属首次。分数虚拟机旨在让企业只需为其所需的GPU容量付费，从八分之一切片的轻量级远程桌面到二分之一级别的大语言模型推理和机器人仿真。谷歌云博客

"企业需要前所未有的灵活性来扩展复杂的AI智能体工作负载，"英伟达超大规模和HPC副总裁兼总经理Ian Buck表示。"通过我们的联合工程技术栈——从Vertex AI上的NVIDIA NeMo到GKE上的NVIDIA Dynamo——我们正在为下一代推理和MoE模型提供一个开放的高性能平台。"谷歌云博客

谷歌云还证实，计划在2026年下半年成为首批提供英伟达Vera Rubin NVL72机架级系统的云服务提供商之一。Vera Rubin平台于2026年CES上首次亮相，在单个机架级系统中集成了72个Rubin GPU和36个Vera CPU，专为AI智能体和混合专家模型的大规模训练和推理而设计。

软件技术栈与客户应用情况

在软件方面，两家公司宣布将英伟达Dynamo与GKE推理网关集成，创建了一个开源控制平面，旨在帮助团队从加速器中获得更高性能，并加快新AI模型的上市速度。谷歌云还扩展了Vertex AI训练集群对运行在英伟达GB200 NVL72上的A4X虚拟机域的支持，增加了主动硬件故障检测功能，以确保持续数周的训练任务顺利进行。Vertex AI模型库现已包含英伟达的Nemotron 3系列开源模型，其中包括拥有1200亿参数的Nemotron 3 Super。谷歌云博客

已于2025年10月正式发布的完整规格G4虚拟机，目前已获得通用汽车、ElevenLabs和Schrödinger等客户的采用。Salesforce首席科学家Silvio Savarese表示，该公司正在使用基于英伟达GB200 NVL72的Vertex AI训练集群为其Agentforce 360平台提供支持，并称其为"企业AI智能体的新标准"。

更广泛的GTC大会背景

这些合作伙伴关系公告是在GTC主题演讲期间宣布的，英伟达首席执行官黄仁勋在演讲中勾勒出了一个以AI智能体和代币经济学为中心的愿景，宣称代币是"新的商品"。英伟达还宣布扩大与亚马逊云服务和微软Azure的云合作伙伴关系，同时发布了关于Vera CPU、Groq 3 LPU以及太空数据中心计划的新细节。谷歌云和英伟达还联合推出了一个为期一年的公共部门AI初创企业加速器项目，为参与者提供英伟达Inception和谷歌云ISV加速器资源的访问权限。

谷歌云与英伟达深化AI合作，发布分数GPU