根据最新数据,中国大语言模型在 OpenRouter 平台占据 61% 的 token 使用量,前三大模型均来自中国。编程和智能体工作流驱动使用量激增,价格优势加速普及,中国模型在全球 AI 基础设施中地位凸显。
根据 2026 年 2 月 24 日发布的周度数据,中国开发的大语言模型目前占据全球最大 LLM API 聚合平台 OpenRouter 上总 token 消耗量的 61%。该平台使用量最高的三个模型均由中国 AI 实验室开发,标志着全球开发者在选择 AI 基础设施方面发生了重大转变。

根据中国科创板日报的报道,MiniMax M2.5 以单周 2.45 万亿 tokens 的消耗量登顶榜首,较前一周激增 197%。月之暗面的 Kimi K2.5 以 1.21 万亿 tokens 位居第二,但其使用量环比下降 20%;智谱 AI 的 GLM-5 以 7800 亿 tokens 排名第三,增幅达 158%。DeepSeek V3.2 位列第五,跻身中国模型阵营。中国模型合计消耗了该平台前十大模型总量 8.7 万亿 tokens 中的 5.3 万亿。news.aibase
MiniMax M2.5 使用量激增的部分原因是免费推广活动。AI 编程工具 Kilo Code 从 2 月 12 日起提供为期一周的免费使用,另一款热门开发工具 Cline 也开展了类似推广。一位 Reddit 用户指出,免费推广曾让 token 排名出现虚高,并提到 Grok 免费提供时也出现过类似情况。不过,MiniMax M2.5 的底层能力本身也备受关注:该模型在 SWE-Bench Verified 上得分 80.2%,与 Anthropic 的 Claude Opus 4.6 的 80.8% 仅相差不到一个百分点。chooseai.net
中国模型的主导地位反映了大语言模型使用方式的更广泛转变。编程已成为 OpenRouter 上 token 消耗量最大的单一类别,在 2025 年期间从 11% 增长至总 token 量的 50% 以上。智能体驱动的工作流(即模型自主执行多步骤任务)目前占据该平台所有输出 token 的一半以上。[Adam Holter](Adam Holter)
据 OpenRouter 首席运营官 Chris Clark 向 SaaStr 透露,中国模型在这些智能体工作负载中的占比极高,因为“中国开源权重模型获得了令人惊讶的市场份额”,原因是“它们在美国公司运行的智能体流程中占比极高”。本周排名前三的中国模型均针对编程和智能体自动化进行了优化。saastr
成本仍然是决定性因素。MiniMax M2.5 每百万输入token收费0.30美元,每百万输出token收费1.10美元,而GLM-5的定价分别为0.30美元和2.55美元。相比之下,Claude Opus 4.6每百万输入token收费5美元,每百万输出token收费25美元——大约贵10到20倍。[Fifth Third Bank](Fifth Third Bank)
OpenRouter平台的每周token消费总量已达到约12.1万亿,是一年前的12.7倍。该平台由OpenSea前CTO Alex Atallah创立,提供统一的API网关,接入了来自60多家提供商的400多个模型。据《麻省理工科技评论》报道,中国开放权重模型在硅谷的采用正在加速,风投公司Andreessen Horowitz合伙人Martin Casado估计,使用开源AI技术栈的初创公司中约有80%在运行中国模型。X (formerly Twitter)
免费获取企业 AI 成熟度诊断报告,发现转型机会
关注公众号

扫码关注,获取最新 AI 资讯
3 步完成企业诊断,获取专属转型建议
已有 200+ 企业完成诊断