订阅我们的每日和每周新闻简报,获取有关行业领先人工智能报道的最新更新和独家内容。了解更多
在今天 CES 2025 的一系列人工智能公告中,英伟达宣布推出 Nemotron 模型系列,以推动代理人工智能的发展。
作为英伟达 NIM 微服务的组成部分,开放的 Llama Nemotron 大型语言模型和 Cosmos Nemotron 视觉语言模型可以在任何加速系统上为人工智能代理提供强大的支持。
人工智能正在进入一个新时代——代理人工智能——在这个时代,专门的代理团队可以帮助人们解决复杂问题并自动化重复性任务。英伟达首席执行官黄仁勋在今天 CES 2025 的开幕主题演讲中宣布了这一消息。
借助定制的人工智能代理,各行各业的企业都可以制造智能并实现前所未有的生产力。这些先进的人工智能代理需要一个由多个生成式人工智能模型组成的系统,这些模型针对代理人工智能功能和能力进行了优化。这种复杂性意味着对强大、高效、企业级模型的需求从未如此迫切。
“人工智能代理是下一个机器人产业,很可能成为一个数十亿美元的机会,”黄仁勋说。
为了为企业代理人工智能提供基础,英伟达今天宣布了 Llama Nemotron 开放大型语言模型 (LLM) 系列。这些模型基于 Llama 构建,可以帮助开发人员在各种应用中创建和部署人工智能代理,包括客户支持、欺诈检测以及产品供应链和库存管理优化。
为了有效地发挥作用,许多人工智能代理需要语言技能和感知世界并做出适当反应的能力。
Nvidia Nemotron
借助新的英伟达 Cosmos Nemotron 视觉语言模型 (VLM) 和英伟达 NIM 微服务,用于视频搜索和摘要,开发人员可以构建能够分析和响应来自自动机器、医院、商店和仓库以及体育赛事、电影和新闻的图像和视频的代理。对于希望为机器人和自动驾驶汽车生成物理感知视频的开发人员,英伟达今天还单独宣布了英伟达 Cosmos 世界基础模型。
开放的 Llama Nemotron 模型优化了人工智能代理的计算效率和准确性。基于 Llama 基础模型(最受欢迎的商业上可行的开源模型集合之一,下载量超过 6.5 亿次)构建,英伟达 Llama Nemotron 模型为人工智能代理开发提供了优化的构建块。
Llama Nemotron 模型经过修剪和训练,使用了英伟达最新的技术和高质量数据集,以增强代理能力。它们擅长指令遵循、聊天、函数调用、编码和数学,同时经过尺寸优化,可以在各种英伟达加速计算资源上运行。
“代理人工智能是人工智能发展的下一个前沿,实现这一机会需要跨 LLM 系统进行全栈优化,以提供高效、准确的人工智能代理,”Meta 的生成式人工智能副总裁兼负责人 Ahmad Al-Dahel 在一份声明中表示。“通过我们与英伟达的合作以及我们对开放模型的共同承诺,基于 Llama 构建的英伟达 Llama Nemotron 系列可以帮助企业快速创建自己的定制人工智能代理。”
预计包括 SAP 和 ServiceNow 在内的领先人工智能代理平台提供商将成为首批使用新的 Llama Nemotron 模型的企业。
“跨多个业务线协作解决复杂任务的人工智能代理将释放出超越当今生成式人工智能场景的全新企业生产力水平,”SAP 首席人工智能官 Philipp Herzig 在一份声明中表示。“通过 SAP 的 Joule,数亿企业用户将与这些代理互动,以比以往更快地实现目标。英伟达新的开放 Llama Nemotron 模型系列将促进多个专门的人工智能代理的开发,从而改变业务流程。”
“人工智能代理使组织能够以更少的努力实现更多目标,为业务转型设定了新的标准,”ServiceNow 平台人工智能副总裁 Jeremy Barnes 在一份声明中表示。“英伟达开放的 Llama Nemotron 模型的性能和准确性得到提升,可以帮助构建先进的人工智能代理服务,解决跨职能的复杂问题,适用于任何行业。”
英伟达 Llama Nemotron 模型使用英伟达 NeMo 进行蒸馏、修剪和对齐。使用这些技术,模型的尺寸足够小,可以在各种计算平台上运行,同时提供高精度以及更高的模型吞吐量。
Llama Nemotron 模型系列将以可下载模型和英伟达 NIM 微服务的形式提供,这些微服务可以轻松部署在云、数据中心、PC 和工作站上。它们为企业提供了业界领先的性能,并可靠、安全、无缝地集成到其代理人工智能应用程序工作流程中。
Llama Nemotron 和 Cosmos Nemotron 模型系列将提供 Nano、Super 和 Ultra 尺寸,为在各个规模部署人工智能代理提供选择。
● Nano:最具成本效益的模型,针对低延迟的实时应用程序进行了优化,非常适合在 PC 和边缘设备上部署。
● Super:高精度模型,在单个 GPU 上提供出色的吞吐量。
● Ultra:最高精度模型,专为需要最高性能的数据中心规模应用程序而设计。
企业还可以使用英伟达 NeMo 微服务为其特定的用例和领域定制模型,以简化数据整理、加速模型定制和评估,并应用护栏以确保响应保持正轨。
借助英伟达 NeMo Retriever,开发人员还可以集成检索增强生成 (RAG) 功能,将模型连接到其企业数据。
使用英伟达用于代理人工智能的蓝图,企业可以快速创建自己的应用程序,利用英伟达的先进人工智能工具和端到端开发专业知识。事实上,英伟达 Cosmos Nemotron、英伟达 Llama Nemotron 和 NeMo Retriever 为今天单独宣布的用于视频搜索和摘要的全新英伟达蓝图提供了强大的支持。
NeMo、NeMo Retriever 和英伟达蓝图都与英伟达 AI Enterprise 软件平台一起提供。
Llama Nemotron 和 Cosmos Nemotron 模型将作为托管 API 和下载模型提供,可在 build.nvidia.com 和 Hugging Face 上获取。英伟达开发者计划成员可以免费访问进行开发、测试和研究。
企业可以在加速数据中心和云基础设施上使用英伟达 AI Enterprise 软件平台在生产环境中运行 Llama Nemotron 和 Cosmos Nemotron NIM 微服务。