Lambda 推出低成本 AI 推理 API,助力企业快速部署 AI 应用
Lambda,这家来自旧金山的公司,以其按需提供图形处理单元 (GPU) 的服务而闻名,为机器学习研究人员和 AI 模型构建者和训练者提供支持。如今,Lambda 迈出了更进一步的步伐,推出了 Lambda 推理 API (应用程序编程接口),并宣称其是市场上同类服务中最具成本效益的选项。
该 API 使企业能够将 AI 模型和应用程序部署到生产环境中,供最终用户使用,而无需担心采购或维护计算资源。此举是对 Lambda 现有业务的补充,其一直专注于提供 GPU 集群,用于训练和微调机器学习模型。
Lambda 副总裁 Robert Brooks 在接受 VentureBeat 采访时表示:“我们的平台完全垂直化,这意味着与 OpenAI 等其他提供商相比,我们可以将显著的成本节约传递给最终用户。此外,没有限制扩展的速率限制,您无需与销售人员交谈即可开始使用。”
事实上,正如 Brooks 向 VentureBeat 透露的那样,开发人员可以访问 Lambda 的全新推理 API 网页,生成 API 密钥,并在不到五分钟的时间内开始使用。
Lambda 的推理 API 支持领先的模型,例如 Meta 的 Llama 3.3 和 3.1、Nous 的 Hermes-3 和阿里巴巴的 Qwen 2.5,使其成为机器学习社区最易于访问的选项之一。完整的模型列表如下:
- deepseek-coder-v2-lite-instruct
- dracarys2-72b-instruct
- hermes3-405b
- hermes3-405b-fp8-128k
- hermes3-70b
- hermes3-8b
- lfm-40b
- llama3.1-405b-instruct-fp8
- llama3.1-70b-instruct-fp8
- llama3.1-8b-instruct
- llama3.2-3b-instruct
- llama3.1-nemotron-70b-instruct
- llama3.3-70b
定价从较小模型(如 Llama-3.2-3B-Instruct)的每百万个令牌 0.02 美元起,并根据较大型的最新模型(如 Llama 3.1-405B-Instruct)的规模而增加,最高可达每百万个令牌 0.90 美元。
正如 Lambda 联合创始人兼首席执行官 Stephen Balaban 最近在 X 上所说:“停止浪费金钱,开始使用 Lambda 进行 LLM 推理。” Balaban 发布了一张图表,展示了其通过推理提供 AI 模型的每令牌成本与该领域竞争对手的对比。
此外,与许多其他服务不同,Lambda 的按需付费模式确保客户仅为其使用的令牌付费,无需订阅或限速计划。
Lambda 在过去十年中一直通过其基于 GPU 的基础设施支持 AI 的发展。从其硬件解决方案到其训练和微调功能,该公司已树立了作为企业、研究机构和初创企业的可靠合作伙伴的声誉。
Brooks 解释说:“请理解,Lambda 在过去十年中一直在向我们的用户群部署 GPU,因此我们拥有数万个英伟达 GPU,其中一些可能来自较旧的生命周期,也有一些来自较新的生命周期,这使我们能够以更低的成本为更广泛的 ML 社区最大限度地利用这些 AI 芯片。”“随着 Lambda 推理的推出,我们正在完成整个 AI 开发生命周期的闭环。新的 API 正式化了许多工程师已经在 Lambda 平台上进行的操作——将其用于推理——但现在有了专门的服务,简化了部署。”
Brooks 指出,其丰富的 GPU 资源是 Lambda 的一大特色,他重申:“Lambda 在过去十年中部署了数万个 GPU,这使我们能够为较旧和较新的 AI 芯片提供具有成本效益的解决方案和最大限度的利用率。”
这种 GPU 优势使该平台能够支持每月扩展到数万亿个令牌,为开发人员和企业提供灵活性。
Lambda 通过提供对高性能推理的无限制访问,将自己定位为云巨头的灵活替代方案。
Brooks 解释说:“我们希望为机器学习社区提供对限速推理 API 的无限制访问。您可以即插即用,阅读文档,并快速扩展到数万亿个令牌。”
该 API 支持各种开源和专有模型,包括流行的指令微调 Llama 模型。
该公司还暗示,在不久的将来将扩展到多模态应用程序,包括视频和图像生成。
Brooks 说:“最初,我们专注于基于文本的 LLM,但很快我们将扩展到多模态和视频文本模型。”
Lambda 推理 API 面向广泛的用户,从初创企业到大型企业,涵盖媒体、娱乐和软件开发等行业。
这些行业越来越多地采用 AI 来为文本摘要、代码生成和生成式内容创建等应用程序提供支持。
Brooks 强调说:“我们的平台上没有用户数据的保留或共享。我们充当将数据提供给最终用户的管道,确保隐私。”这强化了 Lambda 对安全性和用户控制的承诺。
随着 AI 采用率的不断上升,Lambda 的新服务有望吸引寻求经济高效解决方案来部署和维护 AI 模型的企业的关注。通过消除速率限制和高运营成本等常见障碍,Lambda 希望赋能更多组织利用 AI 的潜力。
Lambda 推理 API 现已推出,详细的定价和文档可通过 Lambda 网站获取。