前途科技前途科技
  • 洞察
  • 服务
  • 关于
  • AI 资讯
    • 快讯
    • 产品
    • 技术
    • 商业
    • 政策
    • 初创
  • 洞察
  • 资源中心
    • 深度研究
      • AI 前沿
      • 案例研究
      • AI 知识库
    • 行业报告
      • 白皮书
      • 行业报告
      • 研究报告
      • 技术分享
      • 专题报告
    • 精选案例
      • 金融行业
      • 医疗行业
      • 教育行业
      • 零售行业
      • 制造行业
  • 服务
  • 关于
联系我们

NVIDIA与微软合作打造智能体AI统一部署栈

产品2026年6月1日· 原作者:Dave Salvator· 6 分钟阅读0 阅读

在Microsoft Build大会上,NVIDIA与微软宣布深化合作,推出RTX Spark和DGX Station for Windows等新品,并将NVIDIA开放模型、加速计算和安全运行时OpenShell集成到Windows、Azure和本地环境,为开发者提供端到端的智能体AI部署方案。

智能体AI的时代已经到来,但要兑现其承诺,仅靠好模型还不够。它还需要快速硬件、安全运行时、响应式数据层以及针对长时间推理调优的模型。NVIDIA和微软正在将这一完整技术栈带给开发者,覆盖Windows设备、Azure云和本地部署。

在Microsoft Build大会上,NVIDIA创始人兼CEO黄仁勋通过直播连线,与微软CEO萨提亚·纳德拉共同探讨了双方的合作扩展,包括:NVIDIA RTX Spark 和 DGX Station for Windows、NVIDIA GPU加速的Microsoft Fabric、NVIDIA开放模型在Microsoft Foundry、NVIDIA OpenShell 安全运行时在GitHub Copilot中的集成,以及下一代NVIDIA驱动的AI工厂。

视频:NVIDIA与微软在Microsoft Build 2026

为智能体重塑Windows:从RTX Spark到DGX Station for Windows

NVIDIA和微软正在为AI智能体时代重新构想Windows PC。借助RTX Spark笔记本电脑和小型台式机,以及DGX Station for Windows桌面级AI超级计算机,开发者可以在Windows上原生构建、调优和运行智能体。

NVIDIA DGX Station for Windows桌面级AI超级计算机

RTX Spark是全新开端,驱动全球首批专为个人智能体打造的Windows PC,提供1 petaflop的AI性能、最高128GB统一内存、全天续航,即便不插电也能保持完整AI与图形性能。它融合了NVIDIA三十多年的创新技术,包括CUDA、RTX、DLSS和TensorRT,将于今年秋季从Microsoft Surface、华硕、戴尔、惠普、联想和微星等品牌推出。

DGX Station for Windows是最强大的桌面级AI超级计算机,适用于在Windows企业应用和工作流中构建和运行智能体。它搭载NVIDIA GB300 Grace Blackwell Ultra桌面级超级芯片,拥有最高748GB一致性内存和20 petaflops FP4性能,可运行高达1万亿参数的前沿模型,适用于始终在线的企业级智能体。预计来自华硕、戴尔、技嘉、惠普、微星和超微的系统将在第四季度推出。两款产品均运行NVIDIA OpenShell——一个安全设计的自主智能体运行时。

了解更多:微软博客:“为Windows PC开启强大新篇章,由NVIDIA RTX Spark加速”

借助Microsoft Foundry上的NVIDIA开放模型,以企业级规模驱动智能体工作流

Microsoft Foundry与NVIDIA模型集成

智能体AI运行在模型系统之上。通过Foundry Agent Service中的托管智能体,现在可使用NVIDIA、Anthropic和OpenAI的模型,以及Hermes特殊智能体,企业可以在Azure上构建智能体系统,并内置身份验证和治理。Anthropic的Claude模型现已原生运行在Azure的NVIDIA GB300 Blackwell Ultra系统上,客户将在数周内可用。

NVIDIA Nemotron 3 Ultra是新的开放前沿推理模型,适用于编码、研究和企业工作流中的长时间运行智能体,本月将在Foundry托管计算上可用,同时还有用于语音识别的Nemotron 3.5 ASR和内容安全的Nemotron 3.5。开发者可以将Nemotron与前沿模型和本地模型组合,优化每个工作流的成本和质量。

NVIDIA在Foundry上的开放模型组合现已涵盖智能体、物理和科学AI。NVIDIA Cosmos 3是首个完全开放的全模态物理AI模型,带来视觉推理、世界模拟和动作生成。NVIDIA Earth-2 AI天气模型通过Microsoft Planetary Computer Pro和Foundry提供,用于企业预测和风险分析。

NVIDIA Agent Toolkit和NVIDIA NemoClaw蓝图为开发者提供开放源码平台,在Foundry上构建生产级智能体。NVIDIA CUDA-X库,包括cuDF、cuOpt、AI-Q和NeMo,现在可作为领域特定技能供智能体使用。

了解更多:Build分会场:“使用Microsoft Foundry上的NVIDIA Nemotron模型编排特殊智能体”

为AI时代加速企业数据仓库

数据是智能体AI的燃料,快速访问数据至关重要。

NVIDIA加速计算现已内置于Microsoft Fabric数据仓库,微软内部基准测试显示,对于高并发工作负载,SQL执行速度比CPU基线快6倍,比另外三家领先的云数据仓库供应商快7倍。

企业数据层现在能够跟上持续查询和推理数据的AI智能体,这是NVIDIA与微软多年深度工程协作的成果,从研究到生产。

了解更多:微软博客:“Microsoft Build 2026:使用Microsoft Fabric和Microsoft数据库构建智能体应用”

推进物理AI与自主系统

物理AI是智能体的下一个前沿。

微软正在将NVIDIA的开源物理AI技能和工具与Azure及其物理AI工具链集成。开发者将获得一个统一平台,由Cosmos 3的混合Transformer架构驱动,可以模拟、训练和部署自主系统,包括机器人、自动驾驶车辆和能够感知、推理、规划并在物理世界中行动的工业系统。Cosmos 3在关键基准测试中排名第一,涵盖视觉推理、世界生成和动作生成。

通过NVIDIA RTX PRO 6000 Blackwell服务器版和Nemotron模型增强Azure Local与Foundry Local

智能体AI正在超越云端。

微软将Azure Local上的Foundry Local引入NVIDIA RTX PRO 6000 Blackwell服务器版平台。结合NVIDIA Nemotron开放模型系列,企业可以在其数据所在位置运行高性能AI工作负载,无论是本地、混合还是主权环境,而无需牺牲性能或治理。

Foundry Local on Azure Local现在支持多节点部署和vLLM运行时,为制造业、能源、主权数据中心和其他延迟敏感场景扩展推理能力。

了解更多:微软博客“使用Foundry Local和Azure Local开启物理AI的可能”、“在Azure Local上的Foundry Local扩展本地AI”

通过NVIDIA OpenShell将安全智能体开发引入GitHub Copilot

随着智能体从代码辅助转向自主执行,它们需要真实能力,但无需真实凭证。

NVIDIA OpenShell现已集成到GitHub Copilot,解决了这一问题:每个智能体在独立的沙箱容器中运行,每次出站调用在访问文件、网络或凭证之前都会根据策略进行评估。策略以代码形式编写,在仓库中版本化,并可即时更新。OpenShell采用Apache 2.0开源许可,与模型无关,覆盖本地、混合和云环境。

了解更多:Build闪电演讲:“使用GitHub Copilot和NVIDIA OpenShell保护智能体工作流”

威斯康星州Fairwater正式上线,经NVIDIA Vera Rubin验证

微软Fairwater AI数据中心

微软的威斯康星州Fairwater AI工厂现已提前上线,运行数十万个NVIDIA Grace Blackwell系统,作为一个统一的AI工厂,并与佐治亚州类似规模的AI工厂连接,为最苛刻的前沿模型提供可扩展的分布式AI系统。通过联合工程攻关电源、冷却、NVIDIA Spectrum-X以太网和新的多路径可靠连接(MRC)传输协议,微软的Fairwater AI数据中心设计正在优化令牌经济学。

此外,微软已经验证了现已全面投产的NVIDIA Vera Rubin平台,可用于Azure数据中心部署。

Vera Rubin与Blackwell兼容,无需改造,每兆瓦推理吞吐量提升10倍,每个智能体令牌成本降低一个数量级。内置的NVIDIA机密计算可在智能体大规模推理时保护模型和数据。NVIDIA Dynamo推理框架将这些收益扩展到软件领域,加速AKS上的模型冷启动,并通过NVIDIA Grove提供Kubernetes本地的分布式推理编排。

了解更多:微软博客:“使用NVIDIA Dynamo-Grove在AKS上扩展多节点LLM推理(第4部分)”


原文链接:NVIDIA AI Blog
本文由前途科技编辑整理

标签:NVIDIARTX Spark

想了解 AI 如何助力您的企业?

免费获取企业 AI 成熟度诊断报告,发现转型机会

//

24小时热榜

沃伦要求听证:AI芯片出口漏洞致中国囤积处理器
TOP1

沃伦要求听证:AI芯片出口漏洞致中国囤积处理器

OpenAI与Oracle启动560亿美元数据中心项目
TOP2

OpenAI与Oracle启动560亿美元数据中心项目

3

韦伯望远镜发现138亿年前的星系棒

21小时前
韦伯望远镜发现138亿年前的星系棒
4

中国公司开发AI预测异议

21小时前
中国公司开发AI预测异议
5

NASA局长:蓝色起源发射台修复或需至2028年

21小时前
NASA局长:蓝色起源发射台修复或需至2028年
6

法官阻止转移气候超级计算机

21小时前
法官阻止转移气候超级计算机
7

优步与Autobrains在慕尼黑推自动驾驶出租车

21小时前
优步与Autobrains在慕尼黑推自动驾驶出租车
8

中国军方关联实验室寻求Nvidia H200芯片

21小时前
中国军方关联实验室寻求Nvidia H200芯片
热门标签
大模型AgentRAG微调私有化部署Prompt EngineeringChatGPTClaudeDeepSeek智能客服知识管理内容生成代码辅助数据分析金融零售制造医疗教育AI 战略数字化转型ROI 分析OpenAIAnthropicGoogle

关注公众号

前途科技微信公众号

扫码关注,获取最新 AI 资讯

免费获取 AI 落地指南

3 步完成企业诊断,获取专属转型建议

已有 200+ 企业完成诊断

前途科技前途科技
服务关于快讯技术商业报告
前途科技微信公众号

微信公众号

扫码关注

Copyright © 2026 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。|京ICP备17045010号-1|京公网安备 11010502033860号|隐私政策|服务条款