随着 AI 智能体工作负载激增和供应链瓶颈,AI 服务商纷纷实施限量供应、调整定价,甚至关停产品。OpenAI、Anthropic 等公司面临算力危机,而阿里巴巴却逆向押注,通过补贴吸引用户。
无限量畅用 AI 的时代正走向终结。随着 AI 智能体工作负载激增,叠加供应链瓶颈压缩可用算力,各大 AI 服务商纷纷开始对模型访问实施限量供应、调整定价策略,并被迫做出关停哪些产品的艰难抉择。

据《华尔街日报》报道,OpenAI 的 API token 使用量从 10 月的每分钟 60 亿次激增至 3 月底的每分钟 150 亿次,主要驱动力来自自主编程工具和企业级 AI 智能体工具。OpenAI 首席财务官 Sarah Friar 向该报透露,她现在将大量精力用于寻找短期算力资源,并表示公司正在就哪些项目暂缓推进做出“艰难取舍”。其中一个牺牲品是 Sora 视频生成应用——OpenAI 将于 4 月 26 日关闭该应用,以便将资源重新集中到编程和企业产品上。
Anthropic 面临的压力更为严峻。截至 4 月 8 日的 90 天内,其 Claude API 的正常运行时间仅为 98.95%,远低于业界 99.99% 的标准,并已因此流失了部分企业客户。3 月下旬,Anthropic 收紧了 Claude 订阅用户的会话限制,并开始在非高峰时段提供双倍使用额度以分散负载。数天后,Anthropic 又禁止按固定费率订阅的用户将服务用于驱动 OpenClaw 等第三方 AI 智能体工具,转而引导开发者使用按量计费的 API。
GitHub 于 4 月 10 日宣布对 Copilot 实施新的使用限制,理由是用户增长迅速且使用强度较高。Windsurf 于 3 月将原有的积分制替换为每日和每周使用配额,而 OpenAI 则将其 Codex 的计费方式改为基于 token 的按量计费,并为高强度编程需求推出了月费 100 美元的 Pro 档位。the-decoder
算力短缺的根源在于多重供应链压力的叠加冲击。IDC 将此次内存芯片短缺称为“前所未有的危机”——随着制造商将产能转向 AI 基础设施,现货 DRAM 价格在部分情况下已飙升近 700%。与此同时,卡塔尔氦气出口受阻的问题更是雪上加霜。卡塔尔约供应全球三分之一的氦气,而氦气是冷却 EUV 光刻机的不可替代材料——正是这种机器负责制造先进芯片——因此这一中断直接威胁到半导体的制造环节本身。据 Ornn 算力价格指数显示,现货 GPU 价格在两个月内已上涨 48%。
在西方 AI 实验室纷纷收紧投入之际,阿里巴巴却反其道而行。该公司在农历新年期间斥资 30 亿元人民币(约合 4.32 亿美元)补贴旗下通义千问(Qwen)聊天机器人,并将 Qwen 3.5-Plus API 的定价压低至每百万输入 token 约 0.11 美元,仅为同类产品的约十八分之一。这一策略并非慈善之举,阿里巴巴的如意算盘是:通过补贴 AI 使用,将用户引流至其更广泛的电商和云计算生态系统。然而代价也是实实在在的——受 AI 支出拖累,阿里巴巴最近一个季度的营业利润同比大跌 74%。
OpenAI 自身的预测显示,2026 年亏损额将达 140 亿美元,且 2030 年后才有望实现盈亏平衡。正如 OpenAI 总裁格雷格·布罗克曼所言:“我们建设算力的速度,根本赶不上需求增长的速度。”
免费获取企业 AI 成熟度诊断报告,发现转型机会
关注公众号

扫码关注,获取最新 AI 资讯
3 步完成企业诊断,获取专属转型建议
已有 200+ 企业完成诊断