前途科技前途科技
  • 洞察
  • 服务
  • 关于
  • AI 资讯
    • 快讯
    • 产品
    • 技术
    • 商业
    • 政策
    • 初创
  • 洞察
  • 资源中心
    • 深度研究
      • AI 前沿
      • 案例研究
      • AI 知识库
    • 行业报告
      • 白皮书
      • 行业报告
      • 研究报告
      • 技术分享
      • 专题报告
    • 精选案例
      • 金融行业
      • 医疗行业
      • 教育行业
      • 零售行业
      • 制造行业
  • 服务
  • 关于
联系我们

Qwen3.7-Max 重新定义 AI Agent 基座

AI 前沿2026年5月21日· 5 分钟阅读0 阅读

很多开发者对 AI Agent 的真实体验是:“Demo很惊艳,一上生产就崩溃。”任务稍长就丢上下文,换个框架就性能暴跌,跑几轮就开始“自我循环”……我们需要的是一个能理解意图、规划路径、持续迭代并可靠交付的智能体基座。今天,我们正式发布 Qwen3.7-Max 它在多项权威评测

很多开发者对 AI Agent 的真实体验是:“Demo很惊艳,一上生产就崩溃。”

任务稍长就丢上下文,换个框架就性能暴跌,跑几轮就开始“自我循环”……我们需要的是一个能理解意图、规划路径、持续迭代并可靠交付的智能体基座。

今天,我们正式发布 Qwen3.7-Max 它在多项权威评测中斩获国内第一。并在 35 小时连续自主执行、1158 次工具调用零中断自主任务中证明:长程智能体的稳定性,不再是理论可能,而是工程现实。

Qwen3.7-Max 核心亮点速览


  • 前沿编程智能体:从前端原型到复杂软件工程

  • 持续稳定的长周期自主执行:35小时/1158次调用零中断

  • 办公生产力与工作流自动化:MCP 集成 + 多智能体协作

  • 跨框架泛化 + 深度推理:不挑环境,硬核基准全面领先(完整数据见文末附录)。


我们给 Qwen3.7-Max 布置了一个极限压力测试:在一块训练期从未见过的硬件平台(ZW-M890L PPU)上,自主优化 SGLang 的 Extend Attention 生产级 Kernel。

没有硬件文档、没有性能分析数据,起点只有任务描述、官方 Triton 参考实现和一个评估脚本。在约 35 小时的连续运行中,模型共产出 432 次 kernel 评估,跨越 1158 次工具调用。它完全自主地: 

✅ 编写、编译、性能分析并迭代 CUDA Kernel
✅ 诊断编译报错、修复正确性 Bug
✅ 通过运行时测量定位瓶颈,多次重构底层架构 

最终,在多个工作负载上实现 10.0x 几何平均加速。更关键的是,优化轨迹显示:模型在 30 小时后仍在持续发现实质性改进点。对比同期测试的其他模型(最高仅 7.3x,多数因连续 5 轮无进展而主动退出),Qwen3.7-Max 证明了两种核心能力:

  • 长程策略连贯性 —— 不丢上下文、不退化,超千步仍保持清晰目标

  • In-Context 泛化力 —— 靠运行时反馈而非死记硬背,应对未知硬件也能写出高效 Kernel

“

能跑 35 小时不断片,靠的不是偶然。上千次调用中始终保持策略连贯的底气,来自训练阶段对“环境多样性”的彻底重构。

”

模型泛化能力的本质,不在于“见过多少题”,而在于“在多少种真实环境中训练过”。Qwen3.7-Max 在 Qwen3.5 的环境扩展方法基础上,进一步大幅提升了智能体训练环境的质量与多样性,将 RL 训练从合成数据推向真实分布。

这一策略带来了清晰且稳定的能力跃迁:在综合智能体评测中位列前三,性能逼近行业顶尖水平。

更重要的是,我们观察到极强的性能可预测性:在任意基准子集上的提升,都能高度一致地映射到整体表现。这证明模型学到的不是“应试技巧”,而是可迁移的通用智能体策略。

“

但真实痛点不止于此:很多 AI 模型专门针对某一套框架深度适配,一旦换了平台或工具,表现就大打折扣。这就需要我们在底层架构做一件事——解耦。

”

Qwen3.7-Max 的训练架构采用了“任务-运行框架-验证器”正交解耦设计。强化学习阶段,我们强制模型在不同框架、不同验证器组合下处理同源任务。它学到的不是“某个框架的快捷键”,而是通用的解题策略与工具调用范式。

这意味着:无论你用 Claude Code、OpenClaw、Qwen Code,还是自研的 Tool Use 框架,Qwen3.7-Max 都能即插即用,性能表现高度一致。在真实用户分布的 QwenClawBench 与长链路 CoWorkBench 评测中,无论切换何种运行环境,性能均稳定领先上一代,彻底告别“过拟合特定框架”。

“

底层能力的突破,最终要回归开发者的真实工作流。从写代码到自动化办公,Qwen3.7-Max 如何完成从“辅助插件”到“端到端交付者”的跨越?

”

面向真实生产力场景,Qwen3.7-Max 将成为您的深度协作者。 依托强大的智能体能力,它全面重塑专业工作流:从海量信息的研读整合、复杂数据的深度建模,到出版级文档与可视化生成,精准承接高复杂度、高强度的企业级任务。


编程智能体

Qwen3.7-Max 可以通过一条 prompt 生成丰富的交互式 Web 应用——包括 Three.js 3D 场景、Canvas 动画、完整页面布局和动态 SVG。

Prompt:用Three.js创建一个实时交互的3D粒子系统网页。要求:1. 通过摄像头检测双手张合控制粒子群的收缩与扩散;2. 当手势为1时,粒子组成文字(hello, world),当手势为2时组成文字 (I’am Qwen);3.粒子需实时响应手势变化;4. 用html实现。



MCP 办公与生产力助手

Qwen3.7-Max 可以通过 MCP 工具集成充当智能办公助手。它可以读取一份高校学位论文格式规范,并自动修复一篇排版混乱的论文——包括页面布局、标题样式、字体字号、页边距、目录生成和参考文献格式——全程通过 office-cli 工具自主完成。(注:详细 demo 可查看 Blog https://qwen.ai/blog?id=qwen3.7。)


多智能体与具身扩展

支持主 Agent 规划调度、子 Agent 垂直执行的多智能体编排;同时基于 Tool Use 可直接操控具身设备(如机器狗)完成真实物理环境中的理解、规划与决策,为复杂分布式工作流提供可靠基座。

Prompt:帮我看一下-1楼的Costa咖啡是否关门了


如何使用?

为了方便大家体验 Qwen3.7-Max,我们在 API 协议兼容与框架集成上做了全面对齐。


阿里云百炼(即将上线)

Qwen3.7-Max 即将通过阿里云百炼提供服务。您可以将其与主流智能体框架和编程助手无缝集成。平台完整兼容 OpenAI 规范(Chat Completions / Responses API)与 Anthropic API 协议,支持多地域节点灵活调用。

"""Environment variables:  DASHSCOPE_API_KEY: Your API Key from https://bailian.console.aliyun.com/  DASHSCOPE_BASE_URL: (optional) Base URL for compatible-mode API.    - Beijing: https://dashscope.aliyuncs.com/compatible-mode/v1    - Singapore: https://dashscope-intl.aliyuncs.com/compatible-mode/v1    - US (Virginia): https://dashscope-us.aliyuncs.com/compatible-mode/v1"""from openai import OpenAIimport os
api_key = os.environ.get("DASHSCOPE_API_KEY")ifnot api_key:    raise ValueError(        "DASHSCOPE_API_KEY is required. "        "Set it via: export DASHSCOPE_API_KEY='your-api-key'"    )
client = OpenAI(    api_key=api_key,    base_url=os.environ.get(        "DASHSCOPE_BASE_URL",        "https://dashscope.aliyuncs.com/compatible-mode/v1",    ),)
messages = [{"role": "user", "content": "用Python写一个合并两个有序链表的函数。"}]
completion = client.chat.completions.create(    model="qwen3.7-max",    messages=messages,    extra_body={        "enable_thinking": True,        # "preserve_thinking": True,    },    stream=True)
reasoning_content = ""answer_content = ""is_answering = Falseprint("\n" + "=" * 20 + "Reasoning" + "=" * 20 + "\n")
for chunk in completion:    ifnot chunk.choices:        print("\nUsage:")        print(chunk.usage)        continue
    delta = chunk.choices[0].delta
    if hasattr(delta, "reasoning_content") and delta.reasoning_content is not None:        ifnot is_answering:            print(delta.reasoning_content, end="", flush=True)        reasoning_content += delta.reasoning_content
    if hasattr(delta, "content") and delta.content:        ifnot is_answering:            print("\n" + "=" * 20 + "Answer" + "=" * 20 + "\n")            is_answering = True        print(delta.content, end="", flush=True)        answer_content += delta.content

Qwen3.7-Max 已实现与主流智能体框架的“即插即用”。你无需修改原有 Prompt 或工具链,即可直接在 Claude Code、OpenClaw、Qwen Code 等环境中无缝调用。以下是各框架的快速接入指南:


Claude Code

Qwen API 支持 Anthropic API 协议,可直接与 Claude Code 配合使用:

npm install -g @anthropic-ai/claude-code
export ANTHROPIC_MODEL="qwen3.7-max"export ANTHROPIC_SMALL_FAST_MODEL="qwen3.7-max"export ANTHROPIC_BASE_URL=https://dashscope.aliyuncs.com/apps/anthropicexport ANTHROPIC_AUTH_TOKEN=<your_api_key>
claude


OpenClaw

通过阿里云百炼连接 OpenClaw:

curl -fsSL https://molt.bot/install.sh | bashexport DASHSCOPE_API_KEY=<your_api_key>openclaw dashboard

编辑 ~/.openclaw/openclaw.json 进行配置:

{  "models": {    "mode": "merge",    "providers": {      "bailian": {        "baseUrl": "https://dashscope.aliyuncs.com/compatible-mode/v1",        "apiKey": "DASHSCOPE_API_KEY",        "api": "openai-completions",        "models": [          {            "id": "qwen3.7-max",            "name": "qwen3.7-max",            "reasoning": true,            "input": ["text"],            "contextWindow": 1000000,            "maxTokens": 65536          }        ]      }    }  },  "agents": {    "defaults": {      "model": {        "primary": "bailian/qwen3.7-max"      }    }  }}


Qwen Code

Qwen Code 针对 Qwen 系列进行了深度优化:

npm install -g @qwen-code/qwen-code@latestqwen

模型表现详细图表⬇️

标签:AI大模型

想了解 AI 如何助力您的企业?

免费获取企业 AI 成熟度诊断报告,发现转型机会

//

24小时热榜

法官对五角大楼AI风险标签看法分歧
TOP1

法官对五角大楼AI风险标签看法分歧

特朗普AI行政令:政府将提前审查前沿模型
TOP2

特朗普AI行政令:政府将提前审查前沿模型

3

中国拒批Nvidia降级游戏显卡

4小时前
中国拒批Nvidia降级游戏显卡
4

重新定义Skill开发:保姆级教程&一站式开发助手发布

3小时前
重新定义Skill开发:保姆级教程&一站式开发助手发布
5

从Prompt、Context到Harness,工程的三次进化与终局之战

3小时前
从Prompt、Context到Harness,工程的三次进化与终局之战
6

拒绝2000万收购,NanoClaw团队获1200万融资

4小时前
拒绝2000万收购,NanoClaw团队获1200万融资
7

微软叫停短信验证,云泄露凸显MFA风险

4小时前
微软叫停短信验证,云泄露凸显MFA风险
8

新气候情景:最坏情况降温,1.5°C目标无望

4小时前
新气候情景:最坏情况降温,1.5°C目标无望
热门标签
大模型AgentRAG微调私有化部署Prompt EngineeringChatGPTClaudeDeepSeek智能客服知识管理内容生成代码辅助数据分析金融零售制造医疗教育AI 战略数字化转型ROI 分析OpenAIAnthropicGoogle

关注公众号

前途科技微信公众号

扫码关注,获取最新 AI 资讯

免费获取 AI 落地指南

3 步完成企业诊断,获取专属转型建议

已有 200+ 企业完成诊断

前途科技前途科技
服务关于快讯技术商业报告
前途科技微信公众号

微信公众号

扫码关注

Copyright © 2026 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。|京ICP备17045010号-1|京公网安备 11010502033860号|隐私政策|服务条款