Anthropic又一篇Agent开发神文，新范式让Token消耗暴降98.7%

AI Agent上下文窗口限制

Agent目前最大瓶颈是上下文窗口，当Agent需要连接成百上千个外部工具时，海量的工具定义和中间数据结果会迅速撑爆上下文，导致成本飙升、效率骤降。

Anthropic近期发布了一篇技术博客，介绍了一套全新的Agent解决方案，为Agent开发者提供了重要参考。

Anthropic代码执行新范式示意

简单来说，Anthropic详细阐述了一种名为“代码执行”的新范式，它建立在模型上下文协议（MCP）之上，旨在从根本上解决AI Agent的效率问题。

核心思想很简单：不再让模型直接调用工具，而是让它写代码来调用工具。

Anthropic的数据显示，这一转变能将处理任务的Token消耗从15万降低到2000，成本和时间节省高达98.7%。

那么，这个新范式是如何运作的？它又带来了哪些变化？

AI Agent的两大“隐形税”

Anthropic指出，随着基于MCP构建的Agent越来越普及，开发者们普遍面临两大“Token税”，它们严重拖累了Agent的效率：

第一，工具定义过载

传统的做法是，将所有可用的工具定义一次性加载到模型的上下文中。例如，一个连接了Google Drive和Salesforce的Agent，其上下文会包含类似这样的工具定义：

gdrive.getDocumentDescription: Retrieves a document from Google DriveParameters:&nbsp; documentId (required, string): The ID of the document to retrieve&nbsp; fields (optional, string): Specific fields to returnReturns: Document object with title, body content, metadata,salesforce.updateRecordDescription: Updates a record in SalesforceParameters:&nbsp; objectType (required, string): Type of Salesforce object (Lead, Contact, Account, etc.)&nbsp; recordId (required, string): The ID of the record to update&nbsp; data (required, object): Fields to update with their new

当Agent需要连接数千个工具时，仅仅是这些定义就可能消耗数十万Token，模型还没开始工作，成本就已经产生。

第二，中间结果消耗

更致命的是，工作流中的每一个中间结果都必须经过模型的上下文。

设想一个任务：“从Google Drive下载我的会议纪要，并将其附加到Salesforce的潜在客户记录中。”

模型的处理流程是这样的：

第一次工具调用：gdrive.getDocument(documentId: "abc123")
结果返回：返回完整的会议纪要文本，例如“讨论了Q4目标... [完整纪要文本]”，并将其全部加载进模型上下文
第二次工具调用：salesforce.updateRecord(...)，在其data字段中，模型需要再次写入完整的会议纪要文本

传统MCP客户端工作流

传统AI Agent工具调用流程

这意味着，一份长达2小时会议、可能包含5万Token的纪要，在整个流程中被模型处理了两次。如果文档更大，甚至可能直接超出上下文窗口的限制，导致任务失败。

解决方案：用代码执行取代直接调用

面对上述挑战，Anthropic提出的新范式是：将MCP服务器呈现为代码API，而不是直接的工具调用接口。

Agent的任务不再是选择工具并填充参数，而是编写一小段代码来完成整个工作流。

具体实现上，系统可以将所有可用的工具生成一个文件树结构，例如用TypeScript实现：

servers/├── google-drive/│ &nbsp; ├── getDocument.ts│ &nbsp; └── ... (other tools)├── salesforce/│ &nbsp; ├── updateRecord.ts│ &nbsp; └── ... (other tools)...

每个工具文件（如getDocument.ts）内部封装了对MCP工具的实际调用。

现在，对于前面提到的“会议纪要”任务，Agent生成的不再是工具调用指令，而是这样一段代码：

// 从Google Docs读取纪要并添加到Salesforceimport&nbsp;*&nbsp;as&nbsp;gdrive&nbsp;from&nbsp;'./servers/google-drive';import&nbsp;*&nbsp;as&nbsp;salesforce&nbsp;from&nbsp;'./servers/salesforce';const&nbsp;transcript = (await&nbsp;gdrive.getDocument({&nbsp;documentId:&nbsp;'abc123'&nbsp;})).content;await&nbsp;salesforce.updateRecord({
 objectType:&nbsp;'SalesMeeting',
 recordId:&nbsp;'00Q5f000001abcXYZ',
 data: {
 Notes: transcript
 });

变化是颠覆性的：

按需加载：Agent可以通过浏览文件系统（例如ls ./servers/）来发现可用的服务，然后只读取它完成当前任务所需的文件（getDocument.ts和updateRecord.ts）来理解接口。这避免了开局就加载所有工具定义。
数据本地流转：getDocument返回的transcript内容被存储在一个代码变量中，直接传递给updateRecord函数。整个纪要文本从未进入模型的上下文窗口。

结果就是文章开头提到的惊人数据：Token消耗从15万骤降至2000，效率提升98.7%。Anthropic还提到，Cloudflare也独立发现了类似的模式，并称之为“代码模式”（Code Mode）。这证明了其核心洞察的普适性：LLM天生擅长编写代码，我们应当利用这一优势。

代码执行带来的五大核心优势

这种新范式不仅节省了Token，还带来了一系列深刻的优势，重塑了Agent的能力边界。

1. 渐进式披露

模型无需预知一切。它们可以像人类程序员一样，通过探索文件系统或使用一个search_tools工具来按需发现和学习工具的用法。

2. 上下文高效的工具结果

在处理海量数据时，Agent可以在代码执行环境中进行过滤、转换和聚合，只将最终的、小规模的结果返回给模型。例如，处理一个包含10000行数据的电子表格：

// 传统方式：返回10000行数据到上下文TOOL&nbsp;CALL: gdrive.getSheet(sheetId:&nbsp;'abc123')// 代码执行方式：在环境中过滤，只返回摘要const&nbsp;allRows =&nbsp;await&nbsp;gdrive.getSheet({&nbsp;sheetId:&nbsp;'abc123'&nbsp;});const&nbsp;pendingOrders = allRows.filter(row&nbsp;=>&nbsp;row["Status"] ===&nbsp;'pending');console.log(`发现&nbsp;${pendingOrders.length}&nbsp;个待处理订单`);console.log(pendingOrders.slice(0,&nbsp;5));&nbsp;// 只记录前5个供模型审查

Agent最终看到的可能只是5行样本数据，而不是全部10000行。

3. 更强大的控制流

循环、条件判断、错误处理等复杂的逻辑，现在可以用标准代码模式实现，而不是笨拙地串联多个工具调用。例如，需要轮询Slack等待一条部署完成的消息：

let&nbsp;found =&nbsp;false;while&nbsp;(!found) {
 const&nbsp;messages =&nbsp;await&nbsp;slack.getChannelHistory({&nbsp;channel:&nbsp;'C123456'&nbsp;});
 found = messages.some(m&nbsp;=>&nbsp;m.text.includes('deployment complete'));
 if&nbsp;(!found)&nbsp;await&nbsp;new&nbsp;Promise(r&nbsp;=>&nbsp;setTimeout(r,&nbsp;5000));}console.log('部署完成通知已收到');

这远比“调用工具-休眠-调用工具”的循环更高效，也减少了模型的“首个Token”延迟。

4. 保护隐私的操作

默认情况下，所有中间数据都保留在代码执行环境中。更进一步，执行环境可以自动识别并“令牌化”敏感数据。

例如，Agent写的代码是处理row.email和row.phone，但如果它尝试打印这些数据，模型实际看到的会是[EMAIL_1]和[PHONE_1]。而真实数据则在执行环境中安全地从Google Sheets流向Salesforce，全程不经过模型，有效防止了敏感信息泄露。

5. 状态持久化与技能

通过文件系统访问，Agent可以将中间结果写入文件，从而实现任务的中断和恢复。

const&nbsp;leads =&nbsp;await&nbsp;salesforce.query(...);const&nbsp;csvData = leads.map(l&nbsp;=>&nbsp;...).join('
');await&nbsp;fs.writeFile('./workspace/leads.csv', csvData);

更重要的是，Agent可以将一段成功的代码保存为可复用的函数，也就是一项“技能”（Skill）。

// In ./skills/save-sheet-as-csv.tsexport&nbsp;async&nbsp;function&nbsp;saveSheetAsCsv(sheetId:&nbsp;string) { ... }// Later, in any agent execution:import&nbsp;{ saveSheetAsCsv }&nbsp;from&nbsp;'./skills/save-sheet-as-csv';const&nbsp;csvPath =&nbsp;await&nbsp;saveSheetAsCsv('abc123');

通过不断积累这样的技能，Agent可以构建起一个强大的、可复用的高级能力工具箱。

写在最后

Anthropic认为，尽管上下文管理、工具组合、状态持久化这些问题在AI Agent领域显得很新颖，但它们在传统软件工程中都有成熟的解决方案。

代码执行范式，正是将这些经过时间检验的工程模式应用于AI Agent，让Agent以其最擅长的方式——编写代码——来更高效地与世界互动。

当然，这也带来了新的挑战：运行Agent生成的代码需要一个安全的沙箱环境、资源限制和监控机制。但这是一种权衡，其换来的是Token成本的大幅降低、延迟的缩短以及工具组合能力的极大提升。

Anthropic Agent代码执行新范式：Token消耗暴降98.7%，实现AI效率革命

Anthropic又一篇Agent开发神文，新范式让Token消耗暴降98.7%

AI Agent的两大“隐形税”

解决方案：用代码执行取代直接调用

代码执行带来的五大核心优势

写在最后

发表回复取消回复

最新内容

《亚洲水发展展望2025》深度解读：亚太水安全喜忧参半，未来挑战何在？

谷歌支付6800万美元和解语音助手监听诉讼，你的隐私可能被“误触发”录音

甲骨文豪掷500亿美元押注AI基建，美国数据中心版图加速扩张

OpenAI总裁豪掷2500万美元支持特朗普，科技巨头与政坛的深度捆绑引关注

相关内容

AI安全新动向：OpenAI与Anthropic联手升级青少年保护机制

KnowFlow v2.1.7重磅更新：无缝衔接Dify，分块优化与图片理解增强

Claude Haiku 4.5 发布：Anthropic 小模型性能比肩 GPT-5，速度、成本与安全性解析

用 Cognee 构建端到端知识图谱：打造当前最优AI Agent记忆层

分类

快速链接

Anthropic又一篇Agent开发神文，新范式让Token消耗暴降98.7%

You Might Also Like

AI Agent的两大“隐形税”

解决方案：用代码执行取代直接调用

代码执行带来的五大核心优势

写在最后

发表回复 取消回复

最新内容

分类

快速链接

发表回复取消回复