NVIDIA与微软合作打造智能体AI统一部署栈

智能体AI的时代已经到来，但要兑现其承诺，仅靠好模型还不够。它还需要快速硬件、安全运行时、响应式数据层以及针对长时间推理调优的模型。NVIDIA和微软正在将这一完整技术栈带给开发者，覆盖Windows设备、Azure云和本地部署。

在Microsoft Build大会上，NVIDIA创始人兼CEO黄仁勋通过直播连线，与微软CEO萨提亚·纳德拉共同探讨了双方的合作扩展，包括：NVIDIA RTX Spark 和 DGX Station for Windows、NVIDIA GPU加速的Microsoft Fabric、NVIDIA开放模型在Microsoft Foundry、NVIDIA OpenShell 安全运行时在GitHub Copilot中的集成，以及下一代NVIDIA驱动的AI工厂。

视频：NVIDIA与微软在Microsoft Build 2026

为智能体重塑Windows：从RTX Spark到DGX Station for Windows

NVIDIA和微软正在为AI智能体时代重新构想Windows PC。借助RTX Spark笔记本电脑和小型台式机，以及DGX Station for Windows桌面级AI超级计算机，开发者可以在Windows上原生构建、调优和运行智能体。

NVIDIA DGX Station for Windows桌面级AI超级计算机

RTX Spark是全新开端，驱动全球首批专为个人智能体打造的Windows PC，提供1 petaflop的AI性能、最高128GB统一内存、全天续航，即便不插电也能保持完整AI与图形性能。它融合了NVIDIA三十多年的创新技术，包括CUDA、RTX、DLSS和TensorRT，将于今年秋季从Microsoft Surface、华硕、戴尔、惠普、联想和微星等品牌推出。

DGX Station for Windows是最强大的桌面级AI超级计算机，适用于在Windows企业应用和工作流中构建和运行智能体。它搭载NVIDIA GB300 Grace Blackwell Ultra桌面级超级芯片，拥有最高748GB一致性内存和20 petaflops FP4性能，可运行高达1万亿参数的前沿模型，适用于始终在线的企业级智能体。预计来自华硕、戴尔、技嘉、惠普、微星和超微的系统将在第四季度推出。两款产品均运行NVIDIA OpenShell——一个安全设计的自主智能体运行时。

借助Microsoft Foundry上的NVIDIA开放模型，以企业级规模驱动智能体工作流

Microsoft Foundry与NVIDIA模型集成

智能体AI运行在模型系统之上。通过Foundry Agent Service中的托管智能体，现在可使用NVIDIA、Anthropic和OpenAI的模型，以及Hermes特殊智能体，企业可以在Azure上构建智能体系统，并内置身份验证和治理。Anthropic的Claude模型现已原生运行在Azure的NVIDIA GB300 Blackwell Ultra系统上，客户将在数周内可用。

NVIDIA Nemotron 3 Ultra是新的开放前沿推理模型，适用于编码、研究和企业工作流中的长时间运行智能体，本月将在Foundry托管计算上可用，同时还有用于语音识别的Nemotron 3.5 ASR和内容安全的Nemotron 3.5。开发者可以将Nemotron与前沿模型和本地模型组合，优化每个工作流的成本和质量。

NVIDIA在Foundry上的开放模型组合现已涵盖智能体、物理和科学AI。NVIDIA Cosmos 3是首个完全开放的全模态物理AI模型，带来视觉推理、世界模拟和动作生成。NVIDIA Earth-2 AI天气模型通过Microsoft Planetary Computer Pro和Foundry提供，用于企业预测和风险分析。

NVIDIA Agent Toolkit和NVIDIA NemoClaw蓝图为开发者提供开放源码平台，在Foundry上构建生产级智能体。NVIDIA CUDA-X库，包括cuDF、cuOpt、AI-Q和NeMo，现在可作为领域特定技能供智能体使用。

为AI时代加速企业数据仓库

数据是智能体AI的燃料，快速访问数据至关重要。

NVIDIA加速计算现已内置于Microsoft Fabric数据仓库，微软内部基准测试显示，对于高并发工作负载，SQL执行速度比CPU基线快6倍，比另外三家领先的云数据仓库供应商快7倍。

企业数据层现在能够跟上持续查询和推理数据的AI智能体，这是NVIDIA与微软多年深度工程协作的成果，从研究到生产。

推进物理AI与自主系统

物理AI是智能体的下一个前沿。

微软正在将NVIDIA的开源物理AI技能和工具与Azure及其物理AI工具链集成。开发者将获得一个统一平台，由Cosmos 3的混合Transformer架构驱动，可以模拟、训练和部署自主系统，包括机器人、自动驾驶车辆和能够感知、推理、规划并在物理世界中行动的工业系统。Cosmos 3在关键基准测试中排名第一，涵盖视觉推理、世界生成和动作生成。

通过NVIDIA RTX PRO 6000 Blackwell服务器版和Nemotron模型增强Azure Local与Foundry Local

智能体AI正在超越云端。

微软将Azure Local上的Foundry Local引入NVIDIA RTX PRO 6000 Blackwell服务器版平台。结合NVIDIA Nemotron开放模型系列，企业可以在其数据所在位置运行高性能AI工作负载，无论是本地、混合还是主权环境，而无需牺牲性能或治理。

Foundry Local on Azure Local现在支持多节点部署和vLLM运行时，为制造业、能源、主权数据中心和其他延迟敏感场景扩展推理能力。

通过NVIDIA OpenShell将安全智能体开发引入GitHub Copilot

随着智能体从代码辅助转向自主执行，它们需要真实能力，但无需真实凭证。

NVIDIA OpenShell现已集成到GitHub Copilot，解决了这一问题：每个智能体在独立的沙箱容器中运行，每次出站调用在访问文件、网络或凭证之前都会根据策略进行评估。策略以代码形式编写，在仓库中版本化，并可即时更新。OpenShell采用Apache 2.0开源许可，与模型无关，覆盖本地、混合和云环境。

威斯康星州Fairwater正式上线，经NVIDIA Vera Rubin验证

微软Fairwater AI数据中心

微软的威斯康星州Fairwater AI工厂现已提前上线，运行数十万个NVIDIA Grace Blackwell系统，作为一个统一的AI工厂，并与佐治亚州类似规模的AI工厂连接，为最苛刻的前沿模型提供可扩展的分布式AI系统。通过联合工程攻关电源、冷却、NVIDIA Spectrum-X以太网和新的多路径可靠连接（MRC）传输协议，微软的Fairwater AI数据中心设计正在优化令牌经济学。

此外，微软已经验证了现已全面投产的NVIDIA Vera Rubin平台，可用于Azure数据中心部署。

Vera Rubin与Blackwell兼容，无需改造，每兆瓦推理吞吐量提升10倍，每个智能体令牌成本降低一个数量级。内置的NVIDIA机密计算可在智能体大规模推理时保护模型和数据。NVIDIA Dynamo推理框架将这些收益扩展到软件领域，加速AKS上的模型冷启动，并通过NVIDIA Grove提供Kubernetes本地的分布式推理编排。

原文链接：NVIDIA AI Blog
本文由前途科技编辑整理