订阅我们的每日和每周新闻通讯,获取有关行业领先的 AI 报道的最新更新和独家内容。了解更多
人工智能不再仅仅是一个流行语,它已经成为企业的必备要素。随着各行各业的企业不断采用人工智能,围绕人工智能基础设施的讨论发生了巨大变化。定制的人工智能基础设施曾经被视为一项必要但昂贵的投资,如今已成为一项战略性资产,可以提供关键的竞争优势。
Forrester 副总裁兼首席分析师迈克·瓜尔蒂埃强调了人工智能基础设施的战略重要性。“企业必须投资于来自至少能够跟上,理想情况下能够推动企业人工智能技术发展步伐的供应商的企业 AI/ML 平台,”瓜尔蒂埃说。“这项技术还必须服务于一个在充满智能的世界中重新构想的企业。”这种观点强调了从将人工智能视为一项边缘实验到将其视为未来商业战略核心组成部分的转变。
人工智能革命是由人工智能模型和应用的突破推动的,但这些创新也带来了新的挑战。如今的人工智能工作负载,尤其是在大型语言模型 (LLM) 的训练和推理方面,需要前所未有的计算能力。这就是定制人工智能基础设施发挥作用的地方。
“人工智能基础设施并非一刀切,”瓜尔蒂埃说。“有三个关键工作负载:数据准备、模型训练和推理。”瓜尔蒂埃表示,这些任务中的每一个都有不同的基础设施要求,如果做错了,代价可能会很高。例如,虽然数据准备通常依赖于传统计算资源,但训练像 GPT-4o 或 LLaMA 3.1 这样的大型人工智能模型需要专门的芯片,例如英伟达的 GPU、亚马逊的 Trainium 或谷歌的 TPU。
英伟达凭借其在 GPU 领域的领先地位,在人工智能基础设施方面处于领先地位。“英伟达的成功并非计划的结果,而是实至名归,”瓜尔蒂埃解释说。“他们在正确的时间出现在了正确的地方,一旦他们看到了 GPU 在人工智能方面的潜力,他们就加倍投入。”然而,瓜尔蒂埃认为,竞争即将到来,英特尔和 AMD 等公司正在努力缩小差距。
云计算一直是人工智能的关键推动力量,但随着工作负载的扩展,与云服务相关的成本已成为企业关注的焦点。瓜尔蒂埃表示,云服务非常适合“突发工作负载”——短期、高强度任务。然而,对于全天候运行人工智能模型的企业来说,按需付费的云模型可能会变得过于昂贵。
“一些企业意识到他们需要一种混合方法,”瓜尔蒂埃说。“他们可能会将云用于某些任务,但会投资于内部基础设施来完成其他任务。这关乎平衡灵活性和成本效益。”
亚马逊云科技 (AWS) 的 Amazon SageMaker 通用经理安库尔·梅赫罗特拉也表达了类似的观点。在最近的一次采访中,梅赫罗特拉指出,AWS 客户越来越希望寻找能够将云的灵活性和内部基础设施的控制和成本效益相结合的解决方案。“我们从客户那里听到的是,他们希望获得针对大规模人工智能的专用功能,”梅赫罗特拉解释说。“价格性能至关重要,而你无法使用通用解决方案对其进行优化。”
为了满足这些需求,AWS 一直在增强其 SageMaker 服务,该服务提供托管的人工智能基础设施以及与流行的开源工具(如 Kubernetes 和 PyTorch)的集成。“我们希望为客户提供两全其美的选择,”梅赫罗特拉说。“他们获得了 Kubernetes 的灵活性和可扩展性,但同时还拥有我们托管基础设施的性能和弹性。”
像 PyTorch 和 TensorFlow 这样的开源工具已成为人工智能开发的基础,它们在构建定制人工智能基础设施中的作用不可忽视。梅赫罗特拉强调了支持这些框架以及提供扩展所需的基础设施的重要性。“开源工具是基本要求,”他说。“但如果你只给客户框架而不管理基础设施,就会导致很多重复的繁重工作。”
AWS 的策略是提供可定制的基础设施,该基础设施可以与开源框架无缝协作,同时最大程度地减少客户的操作负担。“我们不希望我们的客户花费时间管理基础设施。我们希望他们专注于构建模型,”梅赫罗特拉说。
瓜尔蒂埃表示同意,并补充说,虽然开源框架至关重要,但它们必须得到强大的基础设施的支持。“开源社区为人工智能做出了惊人的贡献,但归根结底,你需要能够处理现代人工智能工作负载的规模和复杂性的硬件,”他说。
随着企业继续在人工智能领域中探索,对可扩展、高效和定制的人工智能基础设施的需求只会越来越大。当通用人工智能 (AGI)——或代理人工智能——成为现实时,这一点尤其如此。“AGI 将从根本上改变游戏规则,”瓜尔蒂埃说。“这不再仅仅是训练模型和进行预测。代理人工智能将控制整个流程,这将需要更多基础设施。”
梅赫罗特拉也认为人工智能基础设施的未来将迅速发展。“人工智能创新的速度令人惊叹,”他说。“我们正在看到行业特定模型的出现,例如用于金融服务的 BloombergGPT。随着这些利基模型变得越来越普遍,对定制基础设施的需求将会增长。”
AWS、英伟达和其他主要参与者正在竞相满足这一需求,提供更多可定制的解决方案。但正如瓜尔蒂埃指出的那样,这不仅仅关乎技术。“这也关乎合作,”他说。“企业无法独自完成这项工作。他们需要与供应商密切合作,以确保他们的基础设施针对其特定需求进行了优化。”
定制的人工智能基础设施不再仅仅是成本中心,它是一项战略性投资,可以提供显著的竞争优势。随着企业扩大其人工智能目标,他们必须仔细考虑其基础设施选择,以确保他们不仅满足当今的需求,而且为未来做好准备。无论是通过云、内部部署还是混合解决方案,正确的基础设施都可以将人工智能从实验转变为业务驱动力。