加入我们的每日和每周通讯,获取有关行业领先的 AI 报道的最新更新和独家内容。了解更多
英伟达宣布,其英伟达 AI 蓝图将使任何行业的开发人员都能轻松构建 AI 代理来分析视频和图像内容。
英伟达表示,借助这项技术,任何行业现在都可以搜索和汇总海量的视觉数据。
埃森哲、戴尔和联想是利用英伟达 AI 蓝图开发视觉 AI 代理的众多公司之一,这些代理可以提高生产力、优化流程并创造更安全的空间。
全球的企业和公共部门组织正在开发 AI 代理,以增强依赖越来越多的设备(包括摄像头、物联网传感器和车辆)的视觉信息的劳动力的能力。
为了支持他们的工作,英伟达推出了一个新的用于视频搜索和摘要的 AI 蓝图,它将使几乎所有行业的开发人员都能构建分析视频和图像内容的视觉 AI 代理。这些代理可以回答用户的问题、生成摘要并针对特定场景发出警报。
该蓝图是英伟达 Metropolis(一套用于构建视觉 AI 应用程序的开发工具)的一部分,它是一个可定制的工作流程,结合了英伟达计算机视觉和生成式 AI 技术。
包括埃森哲、戴尔和联想在内的全球系统集成商和技术解决方案提供商正在将英伟达 AI 蓝图用于视频搜索和摘要带到全球企业和城市,从而启动下一波 AI 应用程序浪潮,这些应用程序可以部署到工厂、仓库、商店、机场、交通路口等地,以提高生产力和安全性。
英伟达 AI 蓝图在智能城市博览会世界大会之前宣布,它为视觉计算开发人员提供了一套完整的优化软件,用于构建和部署由生成式 AI 支持的代理,这些代理可以摄取和理解海量的实时视频流或数据档案。
用户可以使用自然语言提示而不是僵化的软件代码来定制这些视觉 AI 代理,从而降低了在各个行业和智能城市应用程序中部署虚拟助手的门槛。
视觉 AI 代理由视觉语言模型 (VLM) 提供支持,VLM 是一种生成式 AI 模型,它结合了计算机视觉和语言理解来解释物理世界并执行推理任务。
用于视频搜索和摘要的英伟达 AI 蓝图可以使用英伟达 NIM 微服务来配置 VLM(如英伟达 VILA)、LLM(如 Meta 的 Llama 3.1 405B)和 AI 模型,用于 GPU 加速的问答和上下文感知检索增强生成。
开发人员可以轻松地替换其他 VLM、LLM 和图数据库,并使用英伟达 NeMo 平台针对其独特的环境和用例对其进行微调。
采用英伟达 AI 蓝图可以为开发人员节省数月的努力,他们无需再为智能城市应用程序研究和优化生成式 AI 模型。
它部署在边缘、本地或云端的英伟达 GPU 上,可以极大地加快梳理视频档案以识别关键时刻的过程。
在仓库环境中,使用此工作流程构建的 AI 代理可以在安全协议被违反时提醒工人。在繁忙的路口,AI 代理可以识别交通碰撞并生成报告以帮助紧急救援工作。在公共基础设施领域,维护人员可以要求 AI 代理审查航拍图像并识别正在退化的道路、铁轨或桥梁,以支持主动维护。
除了智能空间之外,视觉 AI 代理还可以用于为视力障碍者总结视频、自动生成体育赛事摘要以及帮助标记海量的视觉数据集以训练其他 AI 模型。
视频搜索和摘要工作流程加入了英伟达 AI 蓝图的集合,这些蓝图使创建 AI 支持的数字化身、构建用于个性化客户服务的虚拟助手以及从 PDF 数据中提取企业洞察变得容易。
英伟达 AI 蓝图可供开发人员免费体验和下载,并且可以在加速数据中心和云中使用英伟达 AI Enterprise(一个端到端软件平台,可加速数据科学管道并简化生成式 AI 的开发和部署)进行生产部署。
企业和公共部门客户还可以借助英伟达的合作伙伴生态系统利用英伟达 AI 蓝图的完整集合。
全球专业服务公司埃森哲已将英伟达 AI 蓝图集成到其埃森哲 AI 精炼厂中,该精炼厂基于英伟达 AI Foundry,使客户能够开发在企业数据上训练的自定义 AI 模型。
东南亚的全球系统集成商(包括马来西亚的 ITMAX 和越南的 FPT)正在基于用于视频搜索和摘要的英伟达 AI 蓝图构建 AI 代理,用于智能城市和智能交通应用程序。
开发人员还可以使用全球服务器制造商提供的计算、网络和软件在英伟达 AI 平台上构建和部署英伟达 AI 蓝图。英伟达 AI 蓝图已集成到戴尔 AI 工厂与英伟达和联想混合 AI 解决方案中。
英伟达 Metropolis 生态系统中的智能城市应用程序提供商 K2K 等公司将使用新的英伟达 AI 蓝图构建分析实时监控交通摄像头的 AI 代理。这将使城市官员能够询问有关街道活动的问题并接收有关改进运营方式的建议。该公司还与意大利巴勒莫市的城市交通管理人员合作,使用 NIM 微服务和英伟达 AI 蓝图部署视觉 AI 代理。
英伟达将在 11 月 7 日之前在巴塞罗那举行的智能城市博览会世界大会上详细介绍此事。