Nvidia 赋能个人电脑,开启 AI 新纪元
Nvidia 近日宣布,其基础模型将运行在搭载 Nvidia RTX AI 的个人电脑上,为数字人、内容创作、生产力和开发带来前所未有的动力。
GeForce 长期以来一直是 AI 开发者的重要平台。2012 年,第一个 GPU 加速的深度学习网络 AlexNet 在 GeForce GTXTM 580 上训练完成。去年,超过 30% 的已发表 AI 研究论文都提到了 GeForce RTX 的使用。Nvidia 首席执行官黄仁勋在 CES 2025 开幕主题演讲中宣布了这一消息。
如今,随着生成式 AI 和 RTX AI 个人电脑的出现,每个人都可以成为开发者。AnythingLLM、ComfyUI、Langflow 和 LM Studio 等新一代低代码和无代码工具,让爱好者可以通过简单的图形用户界面,在复杂的流程中使用 AI 模型。
连接到这些 GUI 的 NIM 微服务将使访问和部署最新的生成式 AI 模型变得轻而易举。基于 NIM 微服务的 Nvidia AI 蓝图,为数字人、内容创作等提供了易于使用、预先配置的参考工作流程。
为了满足 AI 开发者和爱好者不断增长的需求,所有顶级 PC 制造商和系统集成商都推出了支持 NIM 的 RTX AI 个人电脑。
“从感知 AI 到生成式 AI,再到现在的代理 AI,AI 正在以光速发展,”黄仁勋表示。“NIM 微服务和 AI 蓝图为 PC 开发者和爱好者提供了探索 AI 魔力的基础。”
NIM 微服务还将与 Nvidia Digits 一起提供,Digits 是一款个人 AI 超级计算机,为全球的 AI 研究人员、数据科学家和学生提供了访问 Nvidia Grace Blackwell 强大功能的机会。Digits 项目采用全新的 Nvidia GB10 Grace Blackwell 超级芯片,为原型设计、微调和运行大型 AI 模型提供了每秒千万亿次浮点运算的 AI 计算性能。
AI 如何变得更智能
基础模型——在海量原始数据上训练的神经网络——是生成式 AI 的基石。
Nvidia 将为 RTX AI 个人电脑发布一系列来自 Black Forest Labs、Meta、Mistral 和 Stability AI 等顶级模型开发者的 NIM 微服务。应用范围涵盖大型语言模型 (LLM)、视觉语言模型、图像生成、语音、用于检索增强生成 (RAG) 的嵌入模型、PDF 提取和计算机视觉。
“将 FLUX 打造成 Nvidia NIM 微服务,可以加快 AI 的部署速度,让更多用户体验到 AI,同时提供令人难以置信的性能,”Black Forest Labs 首席执行官罗宾·伦巴赫在一份声明中表示。
Nvidia 在今天还宣布了 Llama Nemotron 开放模型系列,该系列模型在各种代理任务中提供高精度。Llama Nemotron Nano 模型将作为 RTX AI 个人电脑和工作站的 NIM 微服务提供,在指令遵循、函数调用、聊天、编码和数学等代理 AI 任务中表现出色。NIM 微服务包含在 PC 上运行 AI 的关键组件,并针对 NVIDIA GPU 的部署进行了优化——无论是在 RTX 个人电脑和工作站中,还是在云端。
开发者和爱好者可以在运行 Windows Subsystem for Linux (WSL) 的 Windows 11 个人电脑上快速下载、设置和运行这些 NIM 微服务。
“AI 正在以前所未有的速度推动 Windows 11 个人电脑的创新,而 Windows Subsystem for Linux (WSL) 为 Windows 11 上的 AI 开发提供了绝佳的跨平台环境,与 Windows Copilot Runtime 相辅相成,”微软 Windows 公司副总裁帕万·达武鲁里在一份声明中表示。“针对 Windows 个人电脑优化的 Nvidia NIM 微服务,为开发者和爱好者提供了可以轻松集成到其 Windows 应用程序中的 AI 模型,进一步加速了 AI 功能的部署,让 Windows 用户受益。”
运行在 RTX AI 个人电脑上的 NIM 微服务将与顶级 AI 开发和代理框架兼容,包括 AI Toolkit for VSCode、AnythingLLM、ComfyUI、CrewAI、Flowise AI、LangChain、Langflow 和 LM Studio。开发者可以通过行业标准端点将基于这些框架构建的应用程序和工作流程连接到运行 NIM 微服务的 AI 模型,使他们能够使用最新的技术,并通过统一的界面跨云、数据中心、工作站和个人电脑进行操作。
爱好者还可以使用即将发布的 Nvidia ChatRTX 技术演示体验一系列 NIM 微服务。
Nvidia AI 蓝图
为了展示爱好者和开发者如何使用 NIM 构建 AI 代理和助手,Nvidia 在今天预告了 Project R2X,这是一个支持视觉的 PC 化身,可以将信息放在用户指尖,协助桌面应用程序和视频会议通话,阅读和总结文档等等。
该化身使用 Nvidia RTX Neural Faces 渲染,这是一种新的生成式 AI 算法,它使用完全生成的像素来增强传统的栅格化。然后,通过新的基于扩散的 NVIDIA Audio2FaceTM-3D 模型对人脸进行动画处理,该模型改进了嘴唇和舌头的运动。R2X 可以连接到云 AI 服务,例如 OpenAI 的 GPT4o 和 xAI 的 Grok,以及 NIM 微服务和 AI 蓝图,例如 PDF 检索器或替代 LLM,通过 CrewAI、Flowise AI 和 Langflow 等开发者框架。
NIM 微服务还通过 AI 蓝图提供给 PC 用户——AI 蓝图是可以在 RTX 个人电脑上本地运行的参考 AI 工作流程。借助这些蓝图,开发者可以从 PDF 文档创建播客,生成以 3D 场景为指导的精美图像等等。
PDF 到播客的蓝图从 PDF 中提取文本、图像和表格,以创建播客脚本,用户可以对其进行编辑。它还可以使用蓝图中提供的语音或基于用户语音样本,从脚本生成完整的音频录制。此外,用户可以与 AI 播客主持人进行实时对话,以了解更多信息。
该蓝图使用 NIM 微服务,例如 Mistral-Nemo-12B-Instruct 用于语言,Nvidia Riva 用于文本到语音和自动语音识别,以及 NeMo Retriever 微服务集合用于 PDF 提取。
3D 指导的生成式 AI 的 AI 蓝图为艺术家提供了对图像生成的更精细控制。虽然 AI 可以从简单的文本提示生成令人惊叹的图像,但仅使用文字来控制图像构图可能很困难。借助此蓝图,创作者可以使用简单的 3D 对象在 Blender 等 3D 渲染器中进行布局,以指导 AI 图像生成。
艺术家可以手动创建 3D 资产,也可以使用 AI 生成 3D 资产,将它们放置在场景中并设置 3D 视口相机。然后,由 FLUX NIM 微服务驱动的预打包工作流程将使用当前构图生成与 3D 场景匹配的高质量图像。
Nvidia NIM 微服务和 AI 蓝图将于 2 月开始提供。支持 NIM 的 RTX AI 个人电脑将由宏碁、华硕、戴尔、技嘉、惠普、联想、微星、雷蛇和三星提供,以及来自 Corsair、Falcon Northwest、LDLC、Maingear、Mifcon、Origin PC、PCS 和 Scan 的本地系统集成商提供。