订阅我们的每日和每周新闻通讯,获取有关行业领先人工智能报道的最新更新和独家内容。了解更多
随着人工智能推动对数据处理前所未有的需求,一家位于山景城的初创公司正在为人工智能最不为人知但最关键的挑战之一提供解决方案:以足够快的速度移动和转换海量数据集,以跟上需求。
Voltron Data 今天宣布与埃森哲建立战略合作伙伴关系,该公司开发了一种 GPU 加速的分析引擎,可以帮助企业克服阻碍人工智能计划的数据准备瓶颈。该公司的核心产品 Theseus 使组织能够使用图形处理单元 (GPU) 而不是传统的计算机处理器 (CPU) 来处理 PB 级数据。
“每个人都专注于你可以触碰和感受的炫酷新事物,但真正重要的是底层的数据集基础,”埃森哲银行和资本市场业务主管迈克尔·阿博特在接受 VentureBeat 独家采访时表示。“为了让 AI 发挥作用,你必须以前所未有的速度和节奏移动数据。”
随着企业争先恐后地采用生成式 AI,他们发现现有的数据基础设施无法处理所需的数据量和速度。随着 AI 代理在企业运营中变得越来越普遍,这一挑战预计将加剧。
“代理将在很短的时间内编写比人类更多的 SQL 查询,”Voltron Data 的首席技术官兼联合创始人罗德里戈·阿拉姆布鲁表示。“如果 CIO 和 CTO 已经表示他们在数据分析和云基础设施上的支出过多,而需求即将大幅提升,那么我们需要大幅降低运行这些查询的成本。”
与传统数据库供应商将 GPU 支持移植到现有系统不同,Voltron Data 从头开始构建其引擎以实现 GPU 加速。“大多数公司在尝试进行 GPU 加速时,会将 GPU 硬塞到现有系统中,”阿拉姆布鲁告诉 VentureBeat。“通过从头开始构建……我们能够获得 10 倍、20 倍、100 倍的性能提升,具体取决于特定工作负载的性能特征。”
该公司将 Theseus 定位为对 Snowflake 和 Databricks 等现有平台的补充,利用 Apache Arrow 框架实现高效的数据移动。“它实际上是所有这些数据库的加速器,而不是竞争对手,”阿博特说。“它仍然使用相同的 SQL 来获得相同的答案,但以并行的方式更快地完成。”
早期采用主要集中在金融服务等数据密集型行业,用例包括欺诈检测、风险建模和监管合规。据阿拉姆布鲁称,一家大型零售商在实施 Theseus 后,将其服务器数量从 1400 台 CPU 机器减少到仅 14 台 GPU 服务器。
自去年 3 月在英伟达 GTC 大会上推出以来,Voltron Data 已获得约 14 家企业客户,其中包括两家大型政府机构。该公司计划发布一个“试驾”版本,允许潜在客户在 TB 级数据集上尝试 GPU 加速查询。
由 AI 需求引发的当前 GPU 短缺对 Voltron Data 来说既是挑战也是机遇。虽然新部署面临硬件限制,但许多企业拥有未充分利用的 GPU 基础设施,这些基础设施最初是为 AI 工作负载购买的,可以在空闲期间重新用于数据处理。
“我们实际上将其视为一项福音,因为市场上有如此多的 GPU,而以前没有,”阿拉姆布鲁指出,并补充说 Theseus 可以有效地运行在可能被弃用的旧 GPU 代上。
这项技术对于处理阿博特所说的“被困数据”的银行来说可能特别有价值——这些数据被锁定在 PDF 和文档等格式中,这些数据可能对 AI 训练很有价值,但难以大规模访问和处理。“你已经看到 Voltron 展示的一些数据,使用这项技术移动数据比标准 CPU 有效和高效 90%,”阿博特说。“这就是力量所在。”
随着企业努力应对 AI 的数据需求,能够加速数据处理和降低基础设施成本的解决方案可能会变得越来越重要。与埃森哲的合作关系可以帮助 Voltron Data 接触到更多面临这些挑战的组织,同时让埃森哲的客户可以使用这项技术,从而显着提高其 AI 计划的性能和效率。