NVIDIA 在 COMPUTEX 上推出 RTX Spark 系列 Windows PC,专为本地 AI 智能体设计,配备 1 petaflop AI 算力和 128GB 统一内存。同时发布 DGX Station for Windows 桌面超级计算机,并与微软合作强化智能体安全与隐私,多项 RTX 生态更新同步亮相。
NVIDIA 在台北 COMPUTEX 的 GTC 活动中发布了 RTX Spark——一个全新的 Windows PC 系列,专为运行本地 AI 智能体而设计。这些智能体可以交互应用、生成内容、自动化重复任务并管理多步骤流程,且所有计算都在本地设备上完成。
RTX Spark 提供 1 petaflop 的 AI 算力和 128GB 统一内存,足以满足设备端智能体的计算需求。它结合了 NVIDIA 30 年的技术创新,涵盖 AI、创作和游戏场景,并具备长续航与高效台式机形态。
此外,NVIDIA 还推出了 DGX Station for Windows,这是一款面向专业人士的 AI 桌面超级计算机,将数据中心级 GPU 和 CPU 引入桌面系统,兼顾 Windows 的可管理性、安全性和兼容性。
智能体安全与生态扩展
NVIDIA 与微软合作,在 Windows 上构建了 OpenShell 运行时,基于微软最新的智能体安全基元,为开发者提供安全、易部署的设备端智能体包。Hermes Agent 和 OpenClaw 等主流智能体项目将在其新 Windows 应用中集成这些安全能力。
NemoClaw 蓝图现已扩展至整个本地 AI 产品线(GeForce RTX、RTX PRO、RTX、DGX Spark 和 DGX Station),提供简化安装程序并支持 Hermes Agent。
推理性能大幅提升
通过与 llama.cpp 社区合作,NVIDIA 实现了多 token 预测(MTP)等优化,在 Qwen 3.6 27B 上带来 2 倍推理性能提升,在 35B 模型上提升 1.6 倍。这些优化已通过 llama.cpp webUI 和 LM Studio 提供。
对于多 GPU 用户,llama.cpp 新增张量并行支持,实现最多 2 倍显存和 1.8 倍计算性能;ComfyUI 则获得新的无分类器指导方法,在两张同等 GPU 上实现 2 倍性能提升。
H Company 桌面智能体工具
H Company 即将为 RTX 和 DGX PC 推出计算机使用工具,包括新的 Holo Computer Use 模型和桌面智能体 harness。NVIDIA 已与其合作量化模型、加速 harness,实现 2 倍加速并降低 35% 显存消耗。模型现已可下载,Holo Desktop 应用即将推出。
DGX Spark 针对 Linux 的优化
对于需要始终可用本地智能体的 Linux 开发者,DGX Spark 提供统一的内存、快速计算和 CUDA 生态兼容性。本月更新的 DGX Spark OS 带来了更流畅的开箱体验,包括简化 NemoClaw 安装程序和更快的推理。
NVIDIA 与 vLLM 合作优化了 Qwen 3.6 35B 的推理,新 NVFP4 checkpoint 相比此前版本在 DGX Spark 上实现 2.6 倍性能提升,并支持 MTP 的 CUDA Graph。
创意应用加速
Adobe 正与 NVIDIA 合作,为 RTX Spark 重新架构 Premiere 和 Photoshop。Firefly 驱动的生成式填充和扩展等数百种工具将在 RTX Spark 上获得最多 2 倍 AI 加速。Adobe 还计划允许用户通过 Windows 智能体在 Premiere 和 Photoshop 中协同创作。
Blender Cycles 将集成 DLSS 4.5 光线重建作为新降噪器,实现交互式实时预览。RTX Video Frame Generation 作为新 AI 效果,可实时将视频帧率提升 2 倍或 4 倍,适合 AI 生成的低帧率视频插帧。
其他更新
更多详情可查看 NVIDIA RTX Spark 官方公告、RTX AI Garage 博客等。



原文链接:NVIDIA AI Blog
本文由前途科技编辑整理
免费获取企业 AI 成熟度诊断报告,发现转型机会
关注公众号

扫码关注,获取最新 AI 资讯
3 步完成企业诊断,获取专属转型建议
已有 200+ 企业完成诊断