印度的人工智能崛起:Nvidia助力“主权人工智能”
在最近于孟买举办的 Nvidia 人工智能峰会上,Nvidia 首席执行官黄仁勋对印度在人工智能领域取得的进展表示赞赏。印度目前拥有超过 2000 家 Nvidia Inception 人工智能公司,以及超过 10 万名接受过人工智能培训的开发者。这与全球范围内接受过 Nvidia 人工智能技术培训的 65 万名开发者相比,印度在人工智能领域的战略性布局已经初见成效。黄仁勋将这种现象称为“主权人工智能”,即国家选择创建自己的 AI 基础设施来维护对其数据的控制。
Nvidia 指出,印度正在成为几乎所有行业的 AI 主要生产者,这得益于数千家初创企业,它们为印度的多语言、多元文化人口提供服务,并扩展到全球用户。印度是全球六大领先的生成式 AI 采用经济体之一,其初创企业和投资者生态系统快速增长,今年的初创企业数量已超过 10 万家,而 2016 年还不到 500 家。
印度超过 2000 家 AI 初创企业加入了 Nvidia Inception,这是一个为初创企业提供的免费计划,旨在通过技术培训和工具、市场营销支持以及与 Inception VC 联盟的风险投资家建立联系的机会来加速创新和增长。
在 Nvidia 人工智能峰会上,大约 50 家印度本土初创企业展示了他们在客户服务、体育媒体、医疗保健和机器人等领域的 AI 创新成果。
Nvidia 的 AI 服务正在使印度的呼叫中心更加高效。
总部位于班加罗尔的初创公司 CoRover.ai 的基于 LLM 的对话式 AI 平台已经拥有超过 10 亿用户,该平台包括文本、音频和视频代理。CoRover 首席执行官 Ankush Sabharwal 在一份声明中表示:“Nvidia Inception 的支持正在帮助我们推进我们的工作,以使用特定领域的庞大语言模型自动执行对话式 AI 使用案例。Nvidia AI 技术使我们能够提供支持 13 亿用户、涵盖 100 多种语言的企业级虚拟助手。”
CoRover 的 AI 平台为印度铁路餐饮和旅游公司(IRCTC)等主要私营和公共部门客户提供聊天机器人和客户服务应用程序,IRCTC 是印度铁路车站和列车的官方在线票务、饮用水和食品供应商。AskDISHA 聊天机器人以梵文中的“方向”命名,每天处理超过 15 万个用户查询,迄今为止已为超过 1.75 亿名乘客促成了超过 100 亿次互动。它帮助客户完成预订或取消火车票、更改登机车站、申请退款以及检查其预订状态等任务,支持的语言包括英语、印地语、古吉拉特语和 Hinglish(印地语和英语的混合语)。
AskDISHA 的部署使 IRCTC 的客户满意度提高了 70%,通过社交媒体、电话和电子邮件等其他渠道的查询量减少了 70%。
CoRover 的模块化 AI 工具是使用 Nvidia NeMo 开发的,Nvidia NeMo 是一个端到端、云原生框架和微服务套件,用于开发生成式 AI。它们在云中的 Nvidia GPU 上运行,使 CoRover 能够在高峰使用期间(例如火车票发布的那一刻)自动扩展计算资源。
Nvidia 还指出,总部位于孟买的 VideoVerse 使用 Nvidia 技术构建了一系列 AI 模型,以支持体育媒体行业中的 AI 辅助内容创作,使包括印度板球超级联赛、越南篮球协会和美国大学橄榄球的山区西部联盟在内的全球客户能够以快 15 倍的速度生成比赛集锦,并提高观看人数。它使用 Magnifi,其技术包括视觉分析,可以检测球员和关键时刻,以生成短视频。
Nvidia 还重点介绍了总部位于孟买的初创公司 Fluid AI,该公司提供生成式 AI 聊天机器人、语音呼叫机器人和一系列应用程序编程接口,以提高企业效率。其 AI 工具让员工能够在 15 秒内完成创建幻灯片等任务。
总部位于班加罗尔的 Karya 是一个基于智能手机的数字工作平台,使印度低收入和边缘化社区的成员能够通过完成支持多语言 AI 模型开发的语言任务来赚取额外收入。近 10 万名 Karya 工作人员正在录制语音样本、转录音频或检查 AI 生成的句子在他们母语中的准确性,他们的工作收入几乎是印度最低工资的 20 倍。Karya 还为所有贡献者提供版税,每次其数据集出售给 AI 开发人员时都会获得版税。
Karya 在印度六个语言组中雇用了超过 3 万名低收入女性参与者来帮助创建数据集,该数据集将支持在农业、医疗保健和银行业等领域创建多样化的 AI 应用程序。
印度正在与 Nvidia 合作投资主权 AI。
Namaste、vanakkam、sat sri akaal——这些只是印度的三种问候方式,印度拥有 22 种宪法承认的语言,以及超过 1500 种由印度人口普查记录的语言。大约 10% 的印度居民说英语,英语是互联网上最常用的语言。
随着印度这个世界上人口最多的国家在数字化方面取得快速进展,其政府和当地初创企业正在开发多语言 AI 模型,使更多印度人能够用他们的母语与技术互动。这是一个主权 AI 的案例研究——开发基于本地数据集的国内 AI 基础设施,反映了该地区的特定方言、文化和实践。
这些公共和私营部门项目正在为印度语和英语构建语言模型,这些模型可以为企业的客户服务 AI 代理提供支持,快速翻译内容以扩大信息获取范围,并使政府服务能够更轻松地触达超过 14 亿人口的多元化人群。
为了支持这些举措,Nvidia 发布了一个印地语的小型语言模型,印地语是印度使用最广泛的语言,拥有超过 5 亿使用者。该模型名为 Nemotron-4-Mini-Hindi-4B,现在可作为 Nvidia NIM 微服务使用,可以轻松部署在任何 Nvidia GPU 加速系统上,以实现最佳性能。
Nvidia 的加速 AI 基础设施平台。
印度 IT 服务和咨询公司 Tech Mahindra 是第一个使用 Nemotron 印地语 NIM 微服务开发 AI 模型的企业,该模型名为 Indus 2.0,专注于印地语及其数十种方言。Indus 2.0 利用 Tech Mahindra 的高质量微调数据进一步提高模型准确性,为银行、教育、医疗保健和其他行业的客户提供本地化服务的机会。
Nemotron 印地语模型拥有 40 亿个参数,源自 Nvidia 开发的 150 亿个参数的多语言语言模型 Nemotron-4 15B。该模型经过剪枝、蒸馏和训练,使用 Nvidia NeMo(一个端到端、云原生框架和微服务套件,用于开发生成式 AI)结合了真实世界印地语数据、合成印地语数据和等量的英语数据。数据集是使用 Nvidia NeMo Curator 创建的,Nvidia NeMo Curator 通过大规模处理高质量的多模态数据来提高生成式 AI 模型的准确性,以进行训练和定制。NeMo Curator 使用 Nvidia RAPIDS 库来加速多节点 GPU 系统上的数据处理管道,从而降低处理时间和总拥有成本。它还提供用于合成数据生成、数据过滤、分类和重复数据删除的预构建管道和构建块,以处理高质量数据。
经过 NeMo 微调后,最终模型在多个准确性基准测试中领先,这些基准测试针对的是参数数量高达 80 亿的 AI 模型。它被包装成 NIM 微服务,可以轻松利用它来支持教育、零售和医疗保健等行业的用例。它作为 Nvidia AI Enterprise 软件平台的一部分提供,该平台为企业提供访问额外资源(包括技术支持和企业级安全性)的机会,以简化生产环境中的 AI 开发。许多印度公司都在使用这些服务。
Nvidia 的技术正在用于在印度构建 AI 工厂。
印度领先的云基础设施提供商和服务器制造商正在加速数据中心容量,Nvidia 将其称为 AI 工厂。到今年年底,他们将在印度的 Nvidia GPU 部署量将比 18 个月前增加近 10 倍。数万个 Nvidia Hopper GPU 将被添加到 AI 工厂(用于生产 AI 的大型数据中心)中,这些 AI 工厂将支持印度的大型企业、初创企业和研究中心在云端和本地运行 AI 工作负载。这将累计提供近 180 exaflops 的计算能力,为医疗保健、金融服务和数字内容创作领域的创新提供动力。
在 Nvidia 人工智能峰会上宣布,这种加速计算技术的建设由数据中心提供商 Yotta Data Services、全球数字生态系统推动者 Tata Communications、云服务提供商 E2E Networks 和原始设备制造商 Netweb 领导。他们的系统将使开发人员能够利用国内数据中心资源,这些资源足够强大,可以推动新一代大型语言模型、复杂的科学可视化和工业数字孪生的发展,这些技术可以将印度推向 AI 加速创新的前沿。
Yotta Data Services 通过其 Shakti Cloud 平台为印度企业、政府部门和研究人员提供托管云服务,以促进生成式 AI 的采用和 AI 教育。这些计算资源由数千个 Nvidia Hopper GPU 提供支持,并辅以 Nvidia AI Enterprise,这是一个端到端、云原生软件平台,可以加速数据科学管道,简化生产级副驾驶和其他生成式 AI 应用程序的开发和部署。
印度的机器人生态系统。
借助 Nvidia AI Enterprise,Yotta 客户可以访问 Nvidia NIM(一组用于优化 AI 推理的微服务)和 Nvidia NIM Agent Blueprints(一组可定制的生成式 AI 应用程序参考架构)。这将使他们能够快速采用优化后的最先进 AI,用于生物分子生成、虚拟化身创建和语言生成等应用程序。
Yotta 首席执行官 Sunil Gupta 在一份声明中表示:“AI 的未来在于速度、灵活性和可扩展性,这就是为什么 Yotta 的 Shakti Cloud 平台旨在消除各行各业的组织在 AI 采用方面面临的常见障碍。Shakti Cloud 将高性能 GPU、优化存储和服务层整合在一起,简化了从模型训练到部署的 AI 开发,因此组织可以快速扩展其 AI 工作,简化运营,并突破 AI 可以实现的目标的界限。”