前途科技
  • AI
  • 初创
  • 报告
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
AI

Lambda 推出低成本 AI 推理服务 API

NEXTECH
Last updated: 2024年12月31日 上午6:53
By NEXTECH
Share
18 Min Read
SHARE

Lambda 推出低成本 AI 推理 API,助力企业快速部署 AI 应用

Lambda,这家来自旧金山的公司,以其按需提供图形处理单元 (GPU) 的服务而闻名,为机器学习研究人员和 AI 模型构建者和训练者提供支持。如今,Lambda 迈出了更进一步的步伐,推出了 Lambda 推理 API (应用程序编程接口),并宣称其是市场上同类服务中最具成本效益的选项。

该 API 使企业能够将 AI 模型和应用程序部署到生产环境中,供最终用户使用,而无需担心采购或维护计算资源。此举是对 Lambda 现有业务的补充,其一直专注于提供 GPU 集群,用于训练和微调机器学习模型。

Lambda 副总裁 Robert Brooks 在接受 VentureBeat 采访时表示:“我们的平台完全垂直化,这意味着与 OpenAI 等其他提供商相比,我们可以将显著的成本节约传递给最终用户。此外,没有限制扩展的速率限制,您无需与销售人员交谈即可开始使用。”

事实上,正如 Brooks 向 VentureBeat 透露的那样,开发人员可以访问 Lambda 的全新推理 API 网页,生成 API 密钥,并在不到五分钟的时间内开始使用。

Lambda 的推理 API 支持领先的模型,例如 Meta 的 Llama 3.3 和 3.1、Nous 的 Hermes-3 和阿里巴巴的 Qwen 2.5,使其成为机器学习社区最易于访问的选项之一。完整的模型列表如下:

  • deepseek-coder-v2-lite-instruct
  • dracarys2-72b-instruct
  • hermes3-405b
  • hermes3-405b-fp8-128k
  • hermes3-70b
  • hermes3-8b
  • lfm-40b
  • llama3.1-405b-instruct-fp8
  • llama3.1-70b-instruct-fp8
  • llama3.1-8b-instruct
  • llama3.2-3b-instruct
  • llama3.1-nemotron-70b-instruct
  • llama3.3-70b

定价从较小模型(如 Llama-3.2-3B-Instruct)的每百万个令牌 0.02 美元起,并根据较大型的最新模型(如 Llama 3.1-405B-Instruct)的规模而增加,最高可达每百万个令牌 0.90 美元。

正如 Lambda 联合创始人兼首席执行官 Stephen Balaban 最近在 X 上所说:“停止浪费金钱,开始使用 Lambda 进行 LLM 推理。” Balaban 发布了一张图表,展示了其通过推理提供 AI 模型的每令牌成本与该领域竞争对手的对比。

此外,与许多其他服务不同,Lambda 的按需付费模式确保客户仅为其使用的令牌付费,无需订阅或限速计划。

Lambda 在过去十年中一直通过其基于 GPU 的基础设施支持 AI 的发展。从其硬件解决方案到其训练和微调功能,该公司已树立了作为企业、研究机构和初创企业的可靠合作伙伴的声誉。

Brooks 解释说:“请理解,Lambda 在过去十年中一直在向我们的用户群部署 GPU,因此我们拥有数万个英伟达 GPU,其中一些可能来自较旧的生命周期,也有一些来自较新的生命周期,这使我们能够以更低的成本为更广泛的 ML 社区最大限度地利用这些 AI 芯片。”“随着 Lambda 推理的推出,我们正在完成整个 AI 开发生命周期的闭环。新的 API 正式化了许多工程师已经在 Lambda 平台上进行的操作——将其用于推理——但现在有了专门的服务,简化了部署。”

Brooks 指出,其丰富的 GPU 资源是 Lambda 的一大特色,他重申:“Lambda 在过去十年中部署了数万个 GPU,这使我们能够为较旧和较新的 AI 芯片提供具有成本效益的解决方案和最大限度的利用率。”

这种 GPU 优势使该平台能够支持每月扩展到数万亿个令牌,为开发人员和企业提供灵活性。

Lambda 通过提供对高性能推理的无限制访问,将自己定位为云巨头的灵活替代方案。

Brooks 解释说:“我们希望为机器学习社区提供对限速推理 API 的无限制访问。您可以即插即用,阅读文档,并快速扩展到数万亿个令牌。”

该 API 支持各种开源和专有模型,包括流行的指令微调 Llama 模型。

该公司还暗示,在不久的将来将扩展到多模态应用程序,包括视频和图像生成。

Brooks 说:“最初,我们专注于基于文本的 LLM,但很快我们将扩展到多模态和视频文本模型。”

Lambda 推理 API 面向广泛的用户,从初创企业到大型企业,涵盖媒体、娱乐和软件开发等行业。

这些行业越来越多地采用 AI 来为文本摘要、代码生成和生成式内容创建等应用程序提供支持。

Brooks 强调说:“我们的平台上没有用户数据的保留或共享。我们充当将数据提供给最终用户的管道,确保隐私。”这强化了 Lambda 对安全性和用户控制的承诺。

随着 AI 采用率的不断上升,Lambda 的新服务有望吸引寻求经济高效解决方案来部署和维护 AI 模型的企业的关注。通过消除速率限制和高运营成本等常见障碍,Lambda 希望赋能更多组织利用 AI 的潜力。

Lambda 推理 API 现已推出,详细的定价和文档可通过 Lambda 网站获取。

Share This Article
Email Copy Link Print
Previous Article 20241230225144682.png Claude 3.5 海库模型现已全面开放
Next Article Dentity收购Trinsic去中心化身份平台,推动Web3数字身份普及
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
中汽协会:2025年4月我国汽车整车出口情况简析
报告
杰富瑞:预计2025年NVIDIA毛利率或突破80%
报告
20250609055410130.png
小米汽车:2025年1-4月小米汽车杭州销量8171辆居首
报告
沃兹情报:2025年5月美国轻型汽车销量1565万辆 迎五年最大跌幅
报告

相关内容

20250328225418569.jpg
AI

无国界AI获3200万美元融资,颠覆人力资源科技

2025年3月29日
A block diagram of the Akida Pico chip design
AI

类脑计算机攻克边缘计算难题

2024年10月2日
AI

Diffbot AI 模型:万亿事实知识图谱赋能精准认知

2025年3月6日
AI

微软Copilot 视觉功能上线,AI 了解你的网络活动

2024年12月17日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
前途科技
Username or Email Address
Password

Lost your password?