主权AI:一场新的科技竞赛?
随着人工智能成为一项基础性技术,世界也逐渐陷入激烈的政治博弈,”主权AI” 正在成为一个国家议题。
试想一下,美国会允许其用于人工智能的数据存储和处理在中国进行吗?欧盟会愿意让其公民的数据被美国科技巨头访问吗?俄罗斯会信任北约国家管理其人工智能资源吗?穆斯林国家会将他们的数据交由以色列用于人工智能吗?
英伟达已拨款 1.1 亿美元,帮助各国培养人工智能初创企业,投资于主权人工智能基础设施,而许多国家也在自行投资人工智能基础设施。这笔巨额资金旨在推动世界拥抱人工智能。问题在于,这种讨论是否只是为了推动销售而进行的思想领导,还是国家真正需要拥抱主权人工智能才能在全球竞争中立于不败之地?这是否是一场对国家来说有意义的新型军备竞赛?
英伟达首席执行官黄仁勋的数字渲染
英伟达首席执行官黄仁勋在 2023 年 11 月的财报电话会议上指出,”主权AI” 的兴起是英伟达人工智能芯片需求增长的原因之一。该公司指出,投资国家计算机基础设施是世界各国政府的新优先事项。
“主权AI云的数量相当可观,” 黄仁勋在财报电话会议上表示。他说,英伟达希望让每家公司都能构建自己的定制人工智能模型。
英伟达首席财务官科莱特·克雷斯在财报电话会议上表示,其动机不仅仅是将国家数据保存在本地科技基础设施中以保护数据,而是看到了投资主权人工智能基础设施以支持经济增长和产业创新的必要性。
就在那时,拜登政府开始限制向中国出售最强大的 AI 芯片,要求在发货前获得美国政府的许可。这项许可要求仍然有效。
因此,据报道,中国开始尝试创建自己的 AI 芯片来与英伟达竞争。但这不仅仅是中国。克雷斯还表示,英伟达正在与印度政府及其大型科技公司(如 Infosys、Reliance 和 Tata)合作,以提升其”主权AI基础设施”。
与此同时,法国私有云提供商 Scaleway 正在投资区域 AI 云,以推动欧洲人工智能的进步,这是”新的经济必要性”的一部分,克雷斯说。她说,这将在未来几年带来”数十亿美元的机会”。
黄仁勋表示,瑞典和日本已开始创建主权 AI 云。
“你看到了主权AI基础设施,人们,国家现在认识到他们必须利用自己的数据,保留自己的数据,保留自己的文化,处理这些数据,并开发自己的 AI。你在印度看到了这一点,” 黄仁勋说。
他补充说:”随着人们意识到他们无法将自己国家的知识、自己国家的文化出口给其他人,然后让他们将 AI 卖回给他们,世界各地都出现了主权AI云。”
英伟达本身将主权AI定义为”一个国家利用其自身基础设施、数据、劳动力和商业网络生产人工智能的能力”。
来源:VentureBeat 使用 DALL-E
在 2024 年 2 月接受 VentureBeat 采访时,黄仁勋再次强调了这一概念,他说:”我们现在拥有一种新型的数据中心,它与 AI 生成有关,一个 AI 生成工厂。你已经听我把它描述为 AI 工厂。基本上,它以数据为原材料,通过这些 AI 超级计算机进行转换,英伟达构建并将其转化为极其宝贵的代币。这些代币是人们在 Midjourney 等令人惊叹的生成式 AI 平台上体验到的东西。”
我问黄仁勋,如果数据无论在世界上的哪个位置都能保持安全,为什么主权AI需要存在于任何特定国家的边界内?
他回答说:”没有理由让其他人来抓取你的互联网,获取你的历史,你的数据。很多数据仍然被锁在图书馆里。在我们的例子中,是国会图书馆。在其他情况下,是国家图书馆。它们已经数字化,但还没有被放到互联网上。”
他补充说:”因此,人们开始意识到他们必须使用自己的数据来创建自己的 AI,并将自己的原材料转化为对他们自己国家有价值的东西,由他们自己国家创造。所以你会看到很多。几乎每个国家都会这样做。他们会建立基础设施。当然,基础设施是硬件。但他们不想使用 AI 出口他们的数据。”
英伟达的希尔帕·科尔哈特卡(左)与加州大学伯克利分校的乔恩·梅茨勒交谈。
英伟达已拨款 1.1 亿美元,投资于帮助主权AI项目和其他 AI 相关业务的人工智能初创企业。
英伟达全球 AI 国家负责人希尔帕·科尔哈特卡在斯坦福大学举行的美日创新研讨会上深入探讨了主权AI。这场 7 月的活动由北加州日本协会和斯坦福美亚科技管理中心主办。
科尔哈特卡与加州大学伯克利分校哈斯商学院的讲师乔恩·梅茨勒进行了访谈。这次谈话的重点是如何通过投资人工智能技术来实现经济增长。科尔哈特卡指出,英伟达早在 ChatGPT 出现之前就已从一家图形公司转型为一家高性能计算和人工智能公司。
“世界各地的许多政府都在关注如何抓住人工智能带来的机遇,他们[专注于]国内人工智能的生产,” 科尔哈特卡说。”我们有阿拉伯国家计划,它与各国今天实施的人工智能战略相匹配。大约 60 到 70 个国家已经制定了人工智能战略,围绕着创建劳动力和拥有生态系统的主要支柱。但它也围绕着在政策框架内拥有所有东西。”
盖蒂图片社的生成式 AI 示例。
英伟达在建立生态系统和基础设施(或超级计算机)方面发挥着作用。她说,英伟达的大部分重点和工程工作都在芯片之上的软件堆栈中。因此,英伟达已成为一家平台公司,而不是一家芯片公司。梅茨勒请科尔哈特卡解释一个国家如何发展”人工智能准备”。
科尔哈特卡说,一个概念是看看一个国家拥有多少计算能力,包括原始 AI 计算、存储以及为这些系统供电所需的能源。它是否拥有操作 AI 的熟练劳动力?人口是否已准备好利用 AI 的巨大民主化,使知识传播到数据科学家之外?
当 ChatGPT-3.5 于 2022 年 11 月出现,生成式 AI 爆发时,它表明 AI 终于以一种普通消费者可以用来自动化许多任务并自行查找新信息或创建图像的方式发挥作用。如果结果存在错误,可能是因为数据模型没有被提供正确的信息。然后很快发现,不同的地区对什么是正确信息有不同的看法。
“该模型主要是在一个主数据集中和西方[地区]的一组特定语言上进行训练的,” 科尔哈特卡说。”这就是为什么拥有主权的、特定于一个国家自己的语言、文化和细微差别的国际化成为首要任务。”
然后,各国开始开发针对特定地区或特定国家特性的生成式 AI 模型,当然还有对这些数据的拥有权,她说。
“拥有权是每个国家的数据和专有数据,他们意识到这些数据应该留在国内,” 她说。
英伟达的 AI 工厂概念。
科尔哈特卡说,英伟达现在正在帮助各国以”AI 工厂”的形式创建这种主权基础设施。这与 100 多年前各国在工业革命期间引发的工厂建设热潮非常相似。
“工厂使用原材料,然后生产出商品,这与国内 GDP 相关。现在,范式是你的最大资产是你的数据。每个国家都有自己独特的语言和数据。这是进入 AI 工厂的原材料,AI 工厂包括算法,包括模型,最终输出的是智能,” 她说。
现在,像日本这样的国家必须考虑他们在 AI 工厂的准备方面是否领先或落后。科尔哈特卡说,日本在投资、合作和研究方面处于领先地位,旨在打造一个成功的”AI 国家”。
她说,公司和国家正在认真考虑将多少 AI 归类为”关键基础设施”,以维护经济或国家安全。如果工业工厂可以在一个城市创造数千个工作岗位,那么数据中心现在也可以在一个地区创造大量工作岗位。这些 AI 工厂是否像几十年前的大坝和机场一样?
“你正在从过去的实体制造业中寻找先例,看看 AI 工厂的乘数效应可能是什么,” 梅茨勒说。”将 AI 工厂视为可能是民用基础设施的想法非常有趣。”
Cerebras Condor Galaxy 在 Colovore 数据中心
梅茨勒提到了在 AI 竞赛中可能出现的策略。例如,他指出,也许较小的国家需要联合起来创建自己的更大的区域网络,以实现一定程度的主权。
科尔哈特卡说,如果你的国家没有三星这样的科技巨头的资源,这可能是有意义的。她指出,北欧国家正在相互合作,美国和日本等国家在人工智能研究方面也正在合作。不同的行业或政府部门也可以在人工智能方面进行合作。
如果英伟达在这方面采取立场,那就是将技术传播开来,让每个人都成为 AI 通。英伟达拥有一所名为深度学习学院的在线大学,提供自定进度的电子学习课程。它还拥有一个名为英伟达 Inception 的虚拟孵化器,该孵化器已支持超过 19,000 家人工智能初创企业。
“英伟达真正相信人工智能的民主化,因为只有当每个人都能使用人工智能时,人工智能的全部潜力才能实现,” 科尔哈特卡说。
AI 能耗
关于处理主权AI带来的后果,梅茨勒指出,各国将不得不处理可持续性问题,即消耗了多少电力。
5 月,电力研究机构(EPRI)发布了一份白皮书,量化了 AI 电力需求的指数级增长潜力。它预测,仅美国数据中心的总数据中心电力消耗量到 2030 年将增长到 2023 年水平的 166% 以上。
它指出,每个 ChatGPT 请求可以消耗 2.9 瓦时电力。这意味着 AI 查询估计需要比传统的 Google 查询多 10 倍的电力,传统的 Google 查询每次使用约 0.3 瓦时电力。这还不包括新兴的计算密集型功能,例如图像、音频和视频生成,这些功能没有可比的先例。
EPRI 考察了四种情景。在增长最快的场景下,数据中心电力使用量到 2030 年将达到 403.9 TWh/年,比 2023 年水平增长 166%。与此同时,低增长情景预测增长 29%,达到 196.3 TWh/年。
“这是关于能源效率,可持续性是每个人都非常关注的问题,” 科尔哈特卡说。
英伟达正试图让每一代 AI 芯片在提高性能的同时,也提高能效。她还指出,该行业正在努力创建和使用可再生能源。英伟达还利用其 AI 输出(以英伟达 Omniverse 软件的形式)来创建数据中心的数字孪生。这些建筑可以从能源消耗的角度进行设计,并以最大限度地减少重复工作的理念进行设计。
一旦完成,虚拟设计就可以在物理世界中以最小的效率进行构建。英伟达甚至正在创建地球的数字孪生,以预测未来几十年的气候变化。AI 技术还可以应用于提高物理基础设施的效率,例如使印度的基础设施更能抵御季风天气。通过这些方式,科尔哈特卡认为 AI 可以用来”拯救世界”。
她补充说:”数据是一个国家最大的资产。它拥有你的专有数据,包括你的语言、你的文化、你的价值观,你是拥有它并将它编码成你想要用于分析的智能的最佳人选。这就是主权的含义。这是在国内层面的。对你的资产、你最大的资产的本地控制[很重要]。”
英伟达 Blackwell 拥有 2080 亿个晶体管。
当然,计算机不知道国界。如果你在世界各地铺设互联网电缆,信息就会流动,一个数据中心理论上可以提供其在全球范围内的信息。如果该数据中心内置了多层安全措施,就不应该担心它位于何处。这是计算机创建”虚拟”基础设施的优势概念。
但这些数据中心需要备份,因为世界已经了解到,过度集中不利于安全和控制等方面。冰岛的火山爆发、日本的 цунами、中国的地震、对基础设施的恐怖袭击或任何特定国家的政府间谍活动——这些都是拥有多个数据中心来存储数据的理由。
除了灾难备份之外,国家安全是促使每个国家在其境内要求拥有自己的计算基础设施的另一个原因。在生成式 AI 兴起之前,就有一项运动旨在确保数据主权,部分原因是某些科技巨头在剥夺用户及其开发个性化数据的应用程序方面做得太过火。数据最佳实践应运而生。
Roblox 首席执行官戴夫·巴祖奇在 Roblox 开发者大会上表示,该公司在全球运营着 27 个数据中心网络,以提供保持其游戏平台在全球不同计算平台上运行所需的性能。Roblox 拥有 7950 万日活跃用户,遍布全球。
鉴于世界各国政府正在制定数据安全和隐私法律,Roblox 很可能不得不改变其数据中心基础设施,以便在特定司法管辖区拥有更多数据中心。
世界上有 195 个国家,如果政策变得限制性,一家公司可能需要拥有 195 个数据中心。并非所有这些划分都是狭隘的。例如,科尔哈特卡说,一些国家可能希望有意减少富国和穷国之间的”数字鸿沟”。
推动 AI 去中心化的另一个因素是隐私的需要。不仅是世界各国政府,还有公司和个人。2024 年备受赞誉的”AI PC”趋势为消费者提供了配备强大 AI 技术的个人电脑,以确保在其家中运行 AI 的隐私。这样,科技巨头就不容易了解你正在搜索的内容以及你用来训练自己个人 AI 网络的数据。
英伟达人形机器人。
黄仁勋表示,各国认为这是必要的,这样才能构建一个包含当地习俗知识的大型语言模型(LLM)。例如,切尔诺贝利在俄语中拼写为 “e”。但在乌克兰,它拼写为 “Chornobyl”。这只是一个小的例子,说明为什么在特定国家使用的系统需要考虑当地的习俗和文化。
有些人担心这种趋势,因为它将世界推向更多地理边界,而在计算领域,这些边界实际上并不存在,也不应该存在。
Geogrify 首席执行官、游戏行业地缘政治专家凯特·爱德华兹在一则消息中说:”我认为这是一个危险的术语,因为’主权’是一个通常意味着权力动态的概念,而权力动态通常是民族主义和民粹主义(在更极端形式中)的基石。我理解为什么这里使用这个词,但我认为这是我们想要描述 AI 的错误方向。”
她补充说:”‘主权’是这个命名法的错误方向。它立即将 AI 的用途两极化,实际上将其置于与核武器和其他形式的大规模破坏相同的社会工具类别。我不认为这是我们真正想要处理这种资源的方式,尤其是因为它可能意味着一个国家政府实际上拥有一个被奴役的智能,其目的是加强和服务于维护特定国家主权的目标——这是绝大多数地缘政治冲突的基础。”
各国是否认真对待英伟达的评论,还是将其视为推销?英伟达并不是唯一一家成功推销的公司。
AMD 在 AI/图形芯片以及 CPU 方面与英伟达竞争。与英伟达一样,它也看到了对 AI 芯片的需求激增。AMD 还继续扩展其在软件方面的努力,收购了 Nod.AI 和 Silo AI 等 AI 软件公司。AI 一直推动着 AMD 的收入以及对其 CPU 和 GPU/AI 芯片的需求。
Cerebras WSE-3
例如,Cerebras Systems 在 2023 年 7 月宣布,它正在将其巨大的晶圆级 CPU 出货给科技控股集团 G42,该公司正在阿联酋建造世界上最大的 AI 训练超级计算机,名为 Condor Galaxy。
它最初是一个由九台互连超级计算机组成的网络,旨在显著减少 AI 模型训练时间,总容量为 36 exaFLOPs,这得益于网络上的第一台 AI 超级计算机 Condor Galaxy 1 (CG-1),它拥有 4 exaFLOPs 和 5400 万个核心,Cerebras 首席执行官安德鲁·费尔德曼在接受 VentureBeat 采访时表示。这些计算机位于美国,但由该公司在阿布扎比运营。(这再次引发了这样一个问题,即主权 AI 技术是否必须位于使用计算能力的国家)。
现在,Cerebras 已经为 G42 打下了新一代 Condor Galaxy 超级计算机的基础。
Cerebras 并没有为其中央处理单元 (CPU) 制造单个芯片,而是采用整个硅晶圆,并在晶圆上印刷其核心,这些晶圆的大小与比萨饼相当。这些晶圆相当于在一个晶圆上拥有数百个芯片,每个晶圆上拥有许多核心。这就是它们如何在单个超级计算机中获得 5400 万个核心的原因。
费尔德曼说:”AI 不仅仅是在吞噬美国。AI 正在吞噬世界。对计算的需求永无止境。模型正在激增。数据是新的黄金。这是基础。”