前途科技前途科技
  • 洞察
  • 服务
  • 关于
  • AI 资讯
    • 快讯
    • 产品
    • 技术
    • 商业
    • 政策
    • 初创
  • 洞察
  • 资源中心
    • 深度研究
      • AI 前沿
      • 案例研究
      • AI 知识库
    • 行业报告
      • 白皮书
      • 行业报告
      • 研究报告
      • 技术分享
      • 专题报告
    • 精选案例
      • 金融行业
      • 医疗行业
      • 教育行业
      • 零售行业
      • 制造行业
  • 服务
  • 关于
联系我们

Lambda 推出低成本 AI 推理服务 API

洞察2024年12月30日· 5 分钟阅读12 阅读

Lambda 推出低成本 AI 推理 API,助力企业快速部署 AI 应用 Lambda,这家来自旧金山的公司 […]

Lambda 推出低成本 AI 推理 API,助力企业快速部署 AI 应用

Lambda,这家来自旧金山的公司,以其按需提供图形处理单元 (GPU) 的服务而闻名,为机器学习研究人员和 AI 模型构建者和训练者提供支持。如今,Lambda 迈出了更进一步的步伐,推出了 Lambda 推理 API (应用程序编程接口),并宣称其是市场上同类服务中最具成本效益的选项。

该 API 使企业能够将 AI 模型和应用程序部署到生产环境中,供最终用户使用,而无需担心采购或维护计算资源。此举是对 Lambda 现有业务的补充,其一直专注于提供 GPU 集群,用于训练和微调机器学习模型。

Lambda 副总裁 Robert Brooks 在接受 VentureBeat 采访时表示:“我们的平台完全垂直化,这意味着与 OpenAI 等其他提供商相比,我们可以将显著的成本节约传递给最终用户。此外,没有限制扩展的速率限制,您无需与销售人员交谈即可开始使用。”

事实上,正如 Brooks 向 VentureBeat 透露的那样,开发人员可以访问 Lambda 的全新推理 API 网页,生成 API 密钥,并在不到五分钟的时间内开始使用。

Lambda 的推理 API 支持领先的模型,例如 Meta 的 Llama 3.3 和 3.1、Nous 的 Hermes-3 和阿里巴巴的 Qwen 2.5,使其成为机器学习社区最易于访问的选项之一。完整的模型列表如下:

  • deepseek-coder-v2-lite-instruct
  • dracarys2-72b-instruct
  • hermes3-405b
  • hermes3-405b-fp8-128k
  • hermes3-70b
  • hermes3-8b
  • lfm-40b
  • llama3.1-405b-instruct-fp8
  • llama3.1-70b-instruct-fp8
  • llama3.1-8b-instruct
  • llama3.2-3b-instruct
  • llama3.1-nemotron-70b-instruct
  • llama3.3-70b

定价从较小模型(如 Llama-3.2-3B-Instruct)的每百万个令牌 0.02 美元起,并根据较大型的最新模型(如 Llama 3.1-405B-Instruct)的规模而增加,最高可达每百万个令牌 0.90 美元。

正如 Lambda 联合创始人兼首席执行官 Stephen Balaban 最近在 X 上所说:“停止浪费金钱,开始使用 Lambda 进行 LLM 推理。” Balaban 发布了一张图表,展示了其通过推理提供 AI 模型的每令牌成本与该领域竞争对手的对比。

此外,与许多其他服务不同,Lambda 的按需付费模式确保客户仅为其使用的令牌付费,无需订阅或限速计划。

Lambda 在过去十年中一直通过其基于 GPU 的基础设施支持 AI 的发展。从其硬件解决方案到其训练和微调功能,该公司已树立了作为企业、研究机构和初创企业的可靠合作伙伴的声誉。

Brooks 解释说:“请理解,Lambda 在过去十年中一直在向我们的用户群部署 GPU,因此我们拥有数万个英伟达 GPU,其中一些可能来自较旧的生命周期,也有一些来自较新的生命周期,这使我们能够以更低的成本为更广泛的 ML 社区最大限度地利用这些 AI 芯片。”“随着 Lambda 推理的推出,我们正在完成整个 AI 开发生命周期的闭环。新的 API 正式化了许多工程师已经在 Lambda 平台上进行的操作——将其用于推理——但现在有了专门的服务,简化了部署。”

Brooks 指出,其丰富的 GPU 资源是 Lambda 的一大特色,他重申:“Lambda 在过去十年中部署了数万个 GPU,这使我们能够为较旧和较新的 AI 芯片提供具有成本效益的解决方案和最大限度的利用率。”

这种 GPU 优势使该平台能够支持每月扩展到数万亿个令牌,为开发人员和企业提供灵活性。

Lambda 通过提供对高性能推理的无限制访问,将自己定位为云巨头的灵活替代方案。

Brooks 解释说:“我们希望为机器学习社区提供对限速推理 API 的无限制访问。您可以即插即用,阅读文档,并快速扩展到数万亿个令牌。”

该 API 支持各种开源和专有模型,包括流行的指令微调 Llama 模型。

该公司还暗示,在不久的将来将扩展到多模态应用程序,包括视频和图像生成。

Brooks 说:“最初,我们专注于基于文本的 LLM,但很快我们将扩展到多模态和视频文本模型。”

Lambda 推理 API 面向广泛的用户,从初创企业到大型企业,涵盖媒体、娱乐和软件开发等行业。

这些行业越来越多地采用 AI 来为文本摘要、代码生成和生成式内容创建等应用程序提供支持。

Brooks 强调说:“我们的平台上没有用户数据的保留或共享。我们充当将数据提供给最终用户的管道,确保隐私。”这强化了 Lambda 对安全性和用户控制的承诺。

随着 AI 采用率的不断上升,Lambda 的新服务有望吸引寻求经济高效解决方案来部署和维护 AI 模型的企业的关注。通过消除速率限制和高运营成本等常见障碍,Lambda 希望赋能更多组织利用 AI 的潜力。

Lambda 推理 API 现已推出,详细的定价和文档可通过 Lambda 网站获取。

想了解 AI 如何助力您的企业?

免费获取企业 AI 成熟度诊断报告,发现转型机会

//

24小时热榜

OpenAI 在 ChatGPT 手机端推出 Codex 编码智能体
TOP1

OpenAI 在 ChatGPT 手机端推出 Codex 编码智能体

OpenAI与苹果合作裂痕加深,考虑采取法律行动
TOP2

OpenAI与苹果合作裂痕加深,考虑采取法律行动

3

微软叫停 Claude Code,全面转向 Copilot CLI

11小时前
微软叫停 Claude Code,全面转向 Copilot CLI
4

2026年科技裁员超10万,AI重塑就业市场

11小时前
2026年科技裁员超10万,AI重塑就业市场
5

法官权衡Anthropic 15亿美元版权和解

7小时前
法官权衡Anthropic 15亿美元版权和解
6

2026年知识库幻觉根治指南:从 Naive RAG 到 Agentic RAG

10小时前
7

腾讯开源Agent Memory,让Token消耗降低61%

10小时前
腾讯开源Agent Memory,让Token消耗降低61%
8

MIT 研究项目因联邦拨款削减缩水10%

11小时前
MIT 研究项目因联邦拨款削减缩水10%
热门标签
大模型AgentRAG微调私有化部署Prompt EngineeringChatGPTClaudeDeepSeek智能客服知识管理内容生成代码辅助数据分析金融零售制造医疗教育AI 战略数字化转型ROI 分析OpenAIAnthropicGoogle

关注公众号

前途科技微信公众号

扫码关注,获取最新 AI 资讯

免费获取 AI 落地指南

3 步完成企业诊断,获取专属转型建议

已有 200+ 企业完成诊断

前途科技前途科技
服务关于快讯技术商业报告
前途科技微信公众号

微信公众号

扫码关注

Copyright © 2026 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。|京ICP备17045010号-1|京公网安备 11010502033860号|隐私政策|服务条款