在Microsoft Build大会上,NVIDIA与微软宣布深化合作,推出RTX Spark和DGX Station for Windows等新品,并将NVIDIA开放模型、加速计算和安全运行时OpenShell集成到Windows、Azure和本地环境,为开发者提供端到端的智能体AI部署方案。
智能体AI的时代已经到来,但要兑现其承诺,仅靠好模型还不够。它还需要快速硬件、安全运行时、响应式数据层以及针对长时间推理调优的模型。NVIDIA和微软正在将这一完整技术栈带给开发者,覆盖Windows设备、Azure云和本地部署。
在Microsoft Build大会上,NVIDIA创始人兼CEO黄仁勋通过直播连线,与微软CEO萨提亚·纳德拉共同探讨了双方的合作扩展,包括:NVIDIA RTX Spark 和 DGX Station for Windows、NVIDIA GPU加速的Microsoft Fabric、NVIDIA开放模型在Microsoft Foundry、NVIDIA OpenShell 安全运行时在GitHub Copilot中的集成,以及下一代NVIDIA驱动的AI工厂。
视频:NVIDIA与微软在Microsoft Build 2026
NVIDIA和微软正在为AI智能体时代重新构想Windows PC。借助RTX Spark笔记本电脑和小型台式机,以及DGX Station for Windows桌面级AI超级计算机,开发者可以在Windows上原生构建、调优和运行智能体。

RTX Spark是全新开端,驱动全球首批专为个人智能体打造的Windows PC,提供1 petaflop的AI性能、最高128GB统一内存、全天续航,即便不插电也能保持完整AI与图形性能。它融合了NVIDIA三十多年的创新技术,包括CUDA、RTX、DLSS和TensorRT,将于今年秋季从Microsoft Surface、华硕、戴尔、惠普、联想和微星等品牌推出。
DGX Station for Windows是最强大的桌面级AI超级计算机,适用于在Windows企业应用和工作流中构建和运行智能体。它搭载NVIDIA GB300 Grace Blackwell Ultra桌面级超级芯片,拥有最高748GB一致性内存和20 petaflops FP4性能,可运行高达1万亿参数的前沿模型,适用于始终在线的企业级智能体。预计来自华硕、戴尔、技嘉、惠普、微星和超微的系统将在第四季度推出。两款产品均运行NVIDIA OpenShell——一个安全设计的自主智能体运行时。
了解更多:微软博客:“为Windows PC开启强大新篇章,由NVIDIA RTX Spark加速”

智能体AI运行在模型系统之上。通过Foundry Agent Service中的托管智能体,现在可使用NVIDIA、Anthropic和OpenAI的模型,以及Hermes特殊智能体,企业可以在Azure上构建智能体系统,并内置身份验证和治理。Anthropic的Claude模型现已原生运行在Azure的NVIDIA GB300 Blackwell Ultra系统上,客户将在数周内可用。
NVIDIA Nemotron 3 Ultra是新的开放前沿推理模型,适用于编码、研究和企业工作流中的长时间运行智能体,本月将在Foundry托管计算上可用,同时还有用于语音识别的Nemotron 3.5 ASR和内容安全的Nemotron 3.5。开发者可以将Nemotron与前沿模型和本地模型组合,优化每个工作流的成本和质量。
NVIDIA在Foundry上的开放模型组合现已涵盖智能体、物理和科学AI。NVIDIA Cosmos 3是首个完全开放的全模态物理AI模型,带来视觉推理、世界模拟和动作生成。NVIDIA Earth-2 AI天气模型通过Microsoft Planetary Computer Pro和Foundry提供,用于企业预测和风险分析。
NVIDIA Agent Toolkit和NVIDIA NemoClaw蓝图为开发者提供开放源码平台,在Foundry上构建生产级智能体。NVIDIA CUDA-X库,包括cuDF、cuOpt、AI-Q和NeMo,现在可作为领域特定技能供智能体使用。
了解更多:Build分会场:“使用Microsoft Foundry上的NVIDIA Nemotron模型编排特殊智能体”
数据是智能体AI的燃料,快速访问数据至关重要。
NVIDIA加速计算现已内置于Microsoft Fabric数据仓库,微软内部基准测试显示,对于高并发工作负载,SQL执行速度比CPU基线快6倍,比另外三家领先的云数据仓库供应商快7倍。
企业数据层现在能够跟上持续查询和推理数据的AI智能体,这是NVIDIA与微软多年深度工程协作的成果,从研究到生产。
了解更多:微软博客:“Microsoft Build 2026:使用Microsoft Fabric和Microsoft数据库构建智能体应用”
物理AI是智能体的下一个前沿。
微软正在将NVIDIA的开源物理AI技能和工具与Azure及其物理AI工具链集成。开发者将获得一个统一平台,由Cosmos 3的混合Transformer架构驱动,可以模拟、训练和部署自主系统,包括机器人、自动驾驶车辆和能够感知、推理、规划并在物理世界中行动的工业系统。Cosmos 3在关键基准测试中排名第一,涵盖视觉推理、世界生成和动作生成。
智能体AI正在超越云端。
微软将Azure Local上的Foundry Local引入NVIDIA RTX PRO 6000 Blackwell服务器版平台。结合NVIDIA Nemotron开放模型系列,企业可以在其数据所在位置运行高性能AI工作负载,无论是本地、混合还是主权环境,而无需牺牲性能或治理。
Foundry Local on Azure Local现在支持多节点部署和vLLM运行时,为制造业、能源、主权数据中心和其他延迟敏感场景扩展推理能力。
了解更多:微软博客“使用Foundry Local和Azure Local开启物理AI的可能”、“在Azure Local上的Foundry Local扩展本地AI”
随着智能体从代码辅助转向自主执行,它们需要真实能力,但无需真实凭证。
NVIDIA OpenShell现已集成到GitHub Copilot,解决了这一问题:每个智能体在独立的沙箱容器中运行,每次出站调用在访问文件、网络或凭证之前都会根据策略进行评估。策略以代码形式编写,在仓库中版本化,并可即时更新。OpenShell采用Apache 2.0开源许可,与模型无关,覆盖本地、混合和云环境。
了解更多:Build闪电演讲:“使用GitHub Copilot和NVIDIA OpenShell保护智能体工作流”

微软的威斯康星州Fairwater AI工厂现已提前上线,运行数十万个NVIDIA Grace Blackwell系统,作为一个统一的AI工厂,并与佐治亚州类似规模的AI工厂连接,为最苛刻的前沿模型提供可扩展的分布式AI系统。通过联合工程攻关电源、冷却、NVIDIA Spectrum-X以太网和新的多路径可靠连接(MRC)传输协议,微软的Fairwater AI数据中心设计正在优化令牌经济学。
此外,微软已经验证了现已全面投产的NVIDIA Vera Rubin平台,可用于Azure数据中心部署。
Vera Rubin与Blackwell兼容,无需改造,每兆瓦推理吞吐量提升10倍,每个智能体令牌成本降低一个数量级。内置的NVIDIA机密计算可在智能体大规模推理时保护模型和数据。NVIDIA Dynamo推理框架将这些收益扩展到软件领域,加速AKS上的模型冷启动,并通过NVIDIA Grove提供Kubernetes本地的分布式推理编排。
了解更多:微软博客:“使用NVIDIA Dynamo-Grove在AKS上扩展多节点LLM推理(第4部分)”
原文链接:NVIDIA AI Blog
本文由前途科技编辑整理
免费获取企业 AI 成熟度诊断报告,发现转型机会
关注公众号

扫码关注,获取最新 AI 资讯
3 步完成企业诊断,获取专属转型建议
已有 200+ 企业完成诊断