黄仁勋再为马斯克送货上门:英伟达AI个人超算DGX Spark终亮相,开启桌面AI新时代
今天星舰第十一飞圆满收官,黄仁勋也闪现到了现场。他亲自飞抵德州星际基地(Starbase),在冲天星舰旁,将一台刚出炉的「核弹」——NVIDIA DGX Spark 个人 AI 超级计算机——亲手交予马斯克。这款备受期待的AI超算,自年初以来一直备受瞩目。


这一幕,让科技爱好者们仿佛回到了2016年。当时,马斯克作为OpenAI的联合创始人,黄仁勋亲自将全球第一台DGX-1超级计算机送至其初创公司办公室。
黄仁勋曾戏称,如果那是唯一出货的产品,项目造价将高达20亿美元。那台“20亿美金的大家伙”随后开启了大模型时代。次年,Google发布了Transformer神经网络训练架构,Sutskever抓住这一突破,引领OpenAI构建了首个GPT模型,这一切均建立在英伟达的超级计算机之上。九年间,马斯克成为全球首富常客,黄仁勋执掌的公司一度位居全球市值榜首。此次英伟达交付的DGX Spark,不再是庞然大物,而是一台可置于桌面、性能强劲的“怪兽”。这再次以引人注目的方式宣告:一个属于每个人的AI超算时代,由此开启。

据透露,APPSO 的 DGX Spark 正在路上,届时将带来更多体验细节,敬请期待。
DGX Spark 能顺利交付,实属不易。今年1月在CES以「Project Digits」之名亮相后,英伟达连续错过了原定的5月和夏季发布日期,迟迟未能出货。这长达半年的等待,令不少人感到担忧,甚至有开发者认为可能彻底跳票。尽管官方对此三缄其口,但行业猜测普遍指向其核心——Grace Blackwell GB10芯片。这款芯片整合了Blackwell GPU部分(与5090显卡采用同款架构)与联发科(MediaTek)共同开发的Grace CPU部分。Blackwell GPU部分早已就绪,但Grace CPU部分的生产却迟迟未能跟上,从而拖延了整个项目进程。“万事俱备,只欠CPU”的局面,竟出现在英伟达身上。在M3 Ultra Mac Studio等竞品凭借高内存带宽抢占市场之际,这台姗姗来迟、且比最初传闻价格高出1000美元的DGX Spark,是否仍值得期待?答案是肯定的!其独树一帜且直击痛点的特性,使其价值不减。经过半年多的等待,DGX Spark究竟有何亮点?本文将为您详细解析。

整台机器的核心在于Grace Blackwell GB10超级芯片。它将一颗20核的ARM架构Grace CPU与一颗强大的Blackwell GPU封装一体,形成了一颗超级芯片。该芯片可提供高达1 Petaflop(千万亿次)的AI计算性能,使用户在桌面上即可体验数据中心级别的强大算力。DGX Spark的另一大优势是其CPU与GPU通过NVIDIA NVLink™-C2C技术无缝连接,共享一个高达128GB的统一内存池。此连接技术的带宽是传统第五代PCIe的五倍,确保了数据在CPU与GPU之间几乎无延迟地高速流转。尽管其内存带宽(273 GB/s)在纸面数据上远低于Mac Studio M3 Ultra(819 GB/s),但英伟达的策略是“大力出奇迹”。

在AI任务中,尤其是在运行大型模型时,能够一次性将整个模型载入内存的巨大容量,其战略价值远超单纯的带宽数字。这意味着用户可以直接在桌面设备上,流畅运行高达2000亿参数的超大语言模型,而无需进行复杂的模型切分。这种体验具有独特优势。Blackwell GPU配备了第五代张量核心(Tensor Cores),并支持FP4/FP8等超低精度格式,性能相较上一代FP8提升了5倍。这犹如为AI计算开启了“涡轮增压”模式,使推理速度显著提升,同时能效比表现出色。如果单台设备不足,DGX Spark还内置了NVIDIA ConnectX®-7 200 Gb/s网络接口。用户可轻松将两台设备连接,组成一个拥有256 GB共享内存的微型集群。英伟达指出,此组合足以处理高达4000亿参数的巨型模型,这已超越个人开发者所能想象的极限。
除了硬件,英伟达强大的护城河——软件生态亦不容忽视。DGX Spark预装了完整的NVIDIA AI软件栈,包含CUDA库、TensorRT及各类NVIDIA NIM™微服务,所有组件均集成于定制的DGXOS(基于Ubuntu)并经过优化。这意味着用户无需花费时间解决兼容性问题,开箱即可投入使用,对于开发者而言,由此节省的时间成本是巨大的。
这场在星舰基地上演的“世纪交接”,仅是一个开端。

自10月15日起,DGX Spark将通过英伟达官网和全球合作伙伴正式发售,定价3999美元。宏碁、华硕、戴尔、联想等众多PC巨头已迅速跟进。该价格较最初承诺的3000美元上涨了1000美元,与顶配Mac Studio M3 Ultra相近。然而,两者的市场定位截然不同:DGX Spark预装的是DGXOS(基于Ubuntu),不支持安装Windows或macOS,它是一台纯粹为AI开发者和专业用户设计的“战斗机器”。其吸引力在于,以4000美元的价格,用户可获得在本地驾驭2000亿参数大模型的强大能力,并享有整个CUDA生态系统的全面支持。对于那些需要在本地处理敏感数据、追求极致性能或希望完全掌控AI工作流程的专业人士而言,此价格具备显著竞争力。对于这台优缺点鲜明的“偏科生”,读者若有更多细节疑问,欢迎留言探讨。

