订阅我们的每日和每周新闻通讯,获取有关行业领先的 AI 报道的最新更新和独家内容。了解更多
Arm 宣布,自推出一年以来,Arm 全面设计生态系统规模已翻倍,推动了全球可持续的硅创新。
Arm 表示,数据中心始终面临着平衡电力需求与 AI 工作负载增长、芯片开发成本和复杂性不断上升以及可持续性需求的挑战。
Arm 基础设施业务线市场营销副总裁 Eddie Ramirez 在一篇博文中表示,该公司一年前推出了 Arm 全面设计,旨在通过创建一个合作伙伴生态系统来应对这些挑战,加速定制硅的开发,将关键行业参与者汇聚在一起,利用 Arm 计算子系统 (CSS) 为未来的数据中心构建解决方案。
该生态系统已迅速发展成为一个多供应商的 Arm 架构的芯粒和 SoC 生态系统,将从设计到代工厂制造的各种能力整合在一起,参与公司数量已翻倍至 30 多家,其中 Alcor Micro、Egis、PUF Security 和 SemiFive 是最新加入该生态系统的公司。
Arm 全面设计激发了全球合作,催生了针对 GenAI 计算的实际 CSS 驱动的解决方案。Arm 表示,一个例子是今天发布的消息,Arm、三星代工厂、ADTechnology 和 Rebellions 正在合作将 AI CPU 芯粒平台推向市场。
该平台针对云、HPC 和 AI/ML 训练和推理工作负载,结合了 Rebellions 的 Rebel AI 加速器,该加速器采用 ADTechnology 提供的 Neoverse CSS V3 驱动的计算芯粒构建,并将在三星代工厂 2 纳米 GAA 先进工艺技术上实现。
该平台有望提供性能和最佳的能效,预计 GenAI 工作负载(Llama3.1 405B 参数 LLM)的效率将提高两到三倍。
“AI 和 HPC 设计需要能够提供最大性能、高晶体管密度和能效的技术解决方案,”三星电子代工厂业务开发主管 Taejoong Song 在一份声明中表示。“三星代工厂的 2 纳米 GAA 工艺旨在满足最严格的 HPC 和 AI 设计要求,我们很高兴利用 Arm CSS 的灵活性和 Arm 全面设计生态系统的强大功能来提供 AI CPU 芯粒平台,这将进一步加速我们领先的边缘技术和设计解决方案在超大规模企业和云服务提供商中的采用。”
Arm 表示,这体现了 Arm 全面设计和基于标准的计算子系统的独特价值,通过整合 Arm 优化的 EDA 工具、全球设计专业知识和代工厂合作伙伴关系,加速 AI 硅开发,便于 AI 加速器设计人员轻松集成。
随着 AI 工作负载的快速发展,紧密耦合的 CPU 计算对于支持完整的 AI 堆栈至关重要。数据预处理、编排、数据库增强技术(如检索增强生成 (RAG))等都将从 Arm Neoverse CPU 的性能效率中受益。我们已将对这些要求的支持融入我们的 CSS,并且通过 Arm 全面设计,该生态系统已经从这些创新中获益。
CSS 和 Arm 全面设计正在帮助为可持续的 AI 数据中心创建硬件基础。Arm 全面设计已经加速了基于 Arm 的测试芯片和芯粒产品的开发,这些产品由 Neoverse N 系列或 V 系列 CSS 提供支持。从云到边缘的各种芯粒解决方案以及它们的开发速度,都是通过降低进入门槛,使广泛的优先访问最新的 CSS 成为可能而直接实现的。
就在今天,Alcor Micro 宣布他们正在构建一个由 CSS 提供支持的芯粒,目标是 AI/ML 训练和推理用例。最近,Alphawave 宣布了他们自己的基于 CSS 的高级计算芯粒,用于 AI/ML、HPC、数据中心和 5G/6G 应用。这些基于 Arm 的芯粒体现了只有 Arm 合作伙伴关系才能提供的多样性、灵活性和全球供应链。
此外,包括 Alphawave、Cadence 和 proteanTecs 在内的 Arm 全面设计合作伙伴正在使用 CSS 在先进节点上验证他们的第三方 IP 产品,以确保符合 Arm 规范和标准。这意味着合作伙伴可以在领先的边缘节点上构建基于 CSS 的定制硅,并获得无缝的开箱即用的软件体验。
这种软件就绪性仍然是 AI 潜力的关键门户,30 多年来,Arm 一直致力于确保 Arm 上的软件“正常运行”。
如今,所有主要框架和操作系统都在 Arm 上运行。对于 Arm 全面设计生态系统而言,这意味着合作伙伴推向市场的各种硅解决方案可以利用同样充满活力且一致的软件生态系统。
Arm Kleidi 技术是这种持续投资的最新例子之一,该技术优化了 Arm 上基于 CPU 的推理,以开源项目(如 PyTorch 和 Llama.cpp)为目标。这对于构建用于边缘 AI 计算的基于 CSS 的芯粒的 Arm 全面设计合作伙伴尤其重要,因为他们不需要加速器。