前途科技
  • AI
  • 初创
  • 报告
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
AI

AI 中间层仍需强劲硬件支撑

NEXTECH
Last updated: 2024年9月28日 下午1:10
By NEXTECH
Share
17 Min Read
SHARE

订阅我们的每日和每周新闻通讯,获取有关行业领先的 AI 报道的最新更新和独家内容。了解更多

本文是 VB 特刊“适合目的:定制 AI 基础设施”的一部分。查看所有其他故事。

随着越来越多的企业寻求构建更多 AI 应用程序甚至 AI 代理,越来越清楚的是,组织应该使用不同的语言模型和数据库来获得最佳结果。

但是,将应用程序从 Llama 3 切换到 Mistral 可能需要一些技术基础设施的技巧。这就是上下文和编排层发挥作用的地方;连接基础模型到应用程序的所谓中间层,理想情况下将控制对模型的 API 调用的流量以执行任务。

中间层主要由 LangChain 或 LlamaIndex 等软件组成,这些软件有助于连接数据库,但问题是,中间层是否仅由软件组成,或者硬件在为支持 AI 应用程序的大部分模型提供动力之外,是否仍然可以发挥作用。

答案是硬件的作用是支持 LangChain 等框架以及将应用程序变为现实的数据库。企业需要拥有能够处理海量数据流的硬件堆栈,甚至可以考虑能够在设备上完成大量数据中心工作的设备。

>>不要错过我们的特刊:适合目的:定制 AI 基础设施。<<

“虽然 AI 中间层主要是一个软件问题,但硬件提供商可以显着影响其性能和效率,”数据管理公司 InterSystems 的数据平台主管 Scott Gnau 说。

许多 AI 基础设施专家告诉 VentureBeat,虽然软件是 AI 编排的基础,但如果服务器和 GPU 无法处理海量数据移动,任何软件都无法工作。

换句话说,为了使软件 AI 编排层正常工作,硬件层需要智能高效,专注于与数据和模型的高带宽、低延迟连接,以处理繁重的负载。

“这种模型编排层需要由快速芯片支持,”IBM 咨询公司生成式 AI 管理合伙人 Matt Candy 在一次采访中说。“我可以预见一个世界,在这个世界中,硅/芯片/服务器能够根据用于不同任务的模型类型和大小进行优化,因为编排层在它们之间切换。”

戴尔全球 CTO 和首席 AI 官 John Roese 告诉 VentureBeat,戴尔制造的硬件在该中间层中仍然发挥着作用。

“这是一个硬件和软件问题,因为人们忘记了 AI 是以软件的形式出现的,”Roese 说。“软件始终运行在硬件上,而 AI 软件是我们构建过的最苛刻的软件,因此您必须了解性能层,即 MIP 在哪里,计算能力在哪里,才能使这些东西正常工作。”

这个 AI 中间层可能需要快速、强大的硬件,但除了目前可用的 GPU 和其他芯片之外,不需要新的专用硬件。

“当然,硬件是一个关键的推动因素,但我不知道是否有专门的硬件能够真正推动它向前发展,除了使模型运行更快的 GPU 之外,”Gnau 说。“我认为软件和架构是您可以以一种类似于织物的形式进行优化的,从而最大限度地减少数据移动。”

AI 代理的兴起使得加强中间层变得更加重要。当 AI 代理开始与其他代理交谈并进行多个 API 调用时,编排层会引导该流量,快速服务器至关重要。

“这一层还提供对所有不同类型的 AI 模型和技术的无缝 API 访问,以及围绕它们的所有无缝用户体验层,”IBM 的 Candy 说。“我称之为这个中间件堆栈中的 AI 控制器。”

AI 代理是该行业目前的热门话题,它们可能会影响企业未来构建其 AI 基础设施的方式。

Roese 补充说,企业需要考虑的另一件事是:设备上的 AI,这是该领域另一个热门话题。他说,公司将希望想象他们的 AI 代理何时需要在本地运行,因为旧的互联网可能会瘫痪。

“要考虑的第二件事是你在哪里运行?”Roese 说。“这就是 AI PC 等事物发挥作用的地方,因为当我有一组代表我工作的代理,并且它们可以互相交谈时,它们是否都必须在同一个地方。”

他补充说,戴尔探索了在设备上添加“礼宾”代理的可能性,“这样,即使您与互联网断开连接,您也可以继续工作。”

生成式 AI 允许技术堆栈扩展,因为更多任务变得更加抽象,带来了提供 GPU 空间、新数据库或 AIOps 服务的新服务提供商。Uniphore 首席执行官 Umesh Sachdev 说,这种情况不会永远持续下去,企业必须记住这一点。

“技术堆栈已经爆炸式增长,但我认为我们将看到它正常化,”Sachdev 说。“最终,人们会将事物内部化,GPU 的容量需求会下降。层和供应商的爆炸总是发生在新的技术中,我们将在 AI 中看到同样的情况。”

对于企业来说,很明显,从软件到硬件,考虑整个 AI 生态系统是实现有意义的 AI 工作流的最佳实践。

Share This Article
Email Copy Link Print
Previous Article Cerebras WSE-3 AI主权之争:各国竞建AI工厂
Next Article 谷歌Gemini自动化功能下月登陆Workspace
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
钟南山:2025年6月底前新冠感染率将达高峰
报告
新势力卷王卖爆!零跑一季度销量大涨162% 营收破百亿
零跑汽车:2025年Q1销量87552台,同比增长162%
报告
乘联会:2025年4月国内乘用车零售175.5万辆,同比增长14.5%
报告
卡塔尔航空:2025财年利润21.5亿美元创纪录
报告

相关内容

20241125190546512.png
AI

AI 代理入门:流程、角色和连接

2024年11月26日
AI

AI模型绝不应该外包的唯一事项

2024年12月18日
AI

AWS Bedrock 多智能体编排

2024年12月6日
A photo of a packaging machine.
AI

可持续供应链

2024年11月20日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
前途科技
Username or Email Address
Password

Lost your password?