万物皆可Agent！Anthropic官方“三步循环法”：手把手教你构建最强智能体

Anthropic在推出Claude Sonnet 4.5时，正式发布了Claude Agent SDK。该SDK旨在帮助开发者在Claude上构建功能强大的自主智能体。实际上，Claude Agent SDK的前身是为支持内部开发效率而生的Claude Code SDK。但在过去数月，其应用早已超越了编码范畴，在Anthropic内部被广泛用于深度研究、视频创作、笔记整理等各种非编程任务，并已成为几乎所有主要智能体循环（Agent Loops）的动力核心。为了体现其更广泛的应用前景，Anthropic决定将其正式更名为Claude Agent SDK。本文将深入解读Anthropic构建该SDK的初衷、如何使用它来打造自己的智能体，以及团队在实际部署中总结出的最佳实践。

核心设计：给Claude一台电脑

Claude Agent SDK背后的核心设计原则非常直接：Claude需要和程序员一样，拥有相同的日常工具。

这意味着，智能体需要能够在代码库中查找文件、编写和编辑文件、进行代码检查（lint）、运行、调试，并在此过程中不断迭代直至成功。

Anthropic团队发现，通过终端给予Claude访问用户计算机的权限，它就获得了像程序员一样编写代码所需的一切。

更重要的是，这也使得Claude在处理非编码任务时同样高效。通过运行bash命令、编辑、创建和搜索文件，Claude能够读取CSV文件、搜索网页、构建可视化图表、解读指标等，胜任各类数字工作——简而言之，成为一个拥有计算机的通用智能体。

让智能体像人类一样使用计算机工作，这正是Claude Agent SDK的关键设计理念。

创建新型智能体

Anthropic相信，为Claude配备一台“电脑”，能够解锁过去难以有效实现的智能体能力。利用该SDK，开发者可以构建：

金融智能体：理解投资组合和目标，通过访问外部API、存储数据和运行代码来帮助评估投资。
个人助理智能体：连接内部数据源，跨应用追踪上下文，帮助预订差旅、管理日历、安排会议、整理简报等。
客户支持智能体：处理高模糊性的用户请求（如客服工单），通过收集和审查用户数据、连接外部API、回复用户，并在必要时将问题升级给人类。
深度研究智能体：在大型文档集合中进行全面研究，通过搜索文件系统、分析和综合多源信息、交叉引用数据，并生成详细报告。

其核心是，该SDK提供了构建智能体所需的基础模块，以自动化任何所需的工作流。

构建Agent循环

在实践中，Claude通常遵循一个特定的反馈循环进行操作：收集上下文 → 采取行动 → 验证工作 → 重复。

Claude Agent循环示意图

这个循环为思考如何构建其他类型的智能体以及应赋予它们何种能力，提供了一个有效的框架。接下来，文章将以构建一个邮件智能体为例，逐步拆解这个过程。

第一步：收集上下文

开发智能体时，不能只给它一个提示，而是要让它能够获取并更新自己的上下文。

智能体搜索与文件系统

文件系统代表了可以被模型调用的潜在信息。当遇到日志等大文件时，Claude会自行决定使用grep、tail等bash脚本来加载最相关的部分。本质上，智能体的文件夹和文件结构本身，就成为了一种上下文工程。例如，邮件智能体可以将过去的对话存储在名为'Conversations'的文件夹中，以便在需要时进行搜索。

子智能体 (Subagents)

SDK默认支持子智能体。其优势有二：一是并行化，可以同时启动多个子智能体处理不同任务；二是上下文管理，子智能体在隔离的上下文中工作，只将相关信息返回给主控者，非常适合处理需要从海量信息中筛选少量有用数据的任务。例如，邮件智能体可以并行启动多个“搜索子智能体”，分别查询邮件历史，并只返回相关的邮件摘要。

压缩 (Compaction)

当智能体长时间运行时，上下文维护至关重要。当接近上下文窗口限制时，SDK的compact功能会自动总结之前的消息，确保智能体不会耗尽上下文空间。

语义搜索

语义搜索虽然速度通常比智能体搜索快，但准确性较低，且维护更困难、透明度更差。Anthropic建议从智能体搜索开始，仅在需要更快速度或更多样化结果时才引入语义搜索。

第二步：采取行动

收集完上下文后，你需要为智能体提供灵活的行动方式。

工具 (Tools)

工具是智能体执行任务的主要构建模块。它们在Claude的上下文窗口中非常突出，是模型决定如何完成任务时优先考虑的选项。因此，你需要精心设计工具以最大化上下文效率。例如，为邮件智能体定义"fetchInbox"或"searchEmails"等核心工具。

Bash与脚本

Bash作为一个通用工具，能让智能体灵活地使用计算机。例如，邮件智能体可以编写代码来下载邮件附件（如PDF），将其转换为文本，然后搜索其中的关键词（如“invoice”）。

pdftotext document.pdf - | grep -n "invoice" | tail -10

代码生成

Claude Agent SDK擅长代码生成。代码具有精确、可组合和可复用的特性，是执行复杂操作的理想选择。例如，Claude.ai中创建Excel、PPT和Word文档的功能，完全依赖于生成Python脚本来实现。对于邮件智能体，可以生成代码，为收到的邮件创建自动化规则：

async function onEmailReceived(email) {
    const isFromCustomer = email.from.includes('@customer.com') || /* ... */;
    if (!isFromCustomer) return;

    const isEmailUrgent = await askLLM(`Does this email seem urgent: ${renderEmail(email)}, return TRUE OR FALSE`);

    if (isEmailUrgent === "TRUE" && isFromCustomer) {
        forwardEmail(email, { to: 'teamlead@company.com' });
        createTask({ title: `Urgent: Respond to ${email.from}` });
    }
}

MCPs (模型上下文协议)

Model Context Protocol (MCP) 提供了与外部服务的标准化集成，能自动处理身份验证和API调用。这意味着你可以轻松将智能体连接到Slack、GitHub、Google Drive或Asana等工具，无需编写自定义集成代码或管理OAuth流程。

第三步：验证工作

智能体循环的最后一步是评估其工作。能够检查并改进自身输出的智能体更加可靠。关键在于给予Claude评估工作的具体方法。

定义规则

最有效的反馈形式是提供明确的输出规则，并在规则未被满足时解释原因。代码检查（Code linting）就是一个典型的基于规则的反馈。例如，生成TypeScript并对其进行检查，通常比直接生成纯JavaScript更好，因为它提供了更多层次的反馈。

视觉反馈

在处理UI生成或测试等视觉任务时，截图或渲染图形式的视觉反馈非常有帮助。例如，在生成HTML格式的邮件后，可以将其截图并返回给模型进行视觉验证，检查布局、样式、内容层级、响应性等是否符合要求。使用像Playwright这样的MCP服务器，可以自动化整个视觉反馈循环。

LLM作为评判者

你也可以让另一个语言模型根据模糊的规则来“评判”智能体的输出。这种方法通常不够稳健，且会带来延迟，但对于追求极致性能的应用场景可能有所帮助。例如，让一个子智能体来判断邮件草稿的语气是否与用户之前的沟通风格一致。

测试与改进你的智能体

在多次迭代智能体循环后，你需要对其进行测试，确保它能胜任任务。最好的改进方法是仔细检查其输出，尤其是在失败的案例中，并设身处地思考：它是否拥有完成这项工作的合适工具？

以下是一些评估时可以自问的问题：

如果智能体误解了任务，是否缺少关键信息？能否调整搜索API的结构，让它更容易找到所需内容？
如果智能体在某个任务上反复失败，能否在工具调用中添加一个正式规则来识别和修复该失败？
如果智能体无法修复自己的错误，能否提供更有用或更有创意的工具来解决问题？
如果智能体的性能随着功能增加而波动，是否应根据客户使用情况构建一个代表性的测试集，进行程序化评估？

具体操作请参阅官方文档：

https://docs.claude.com/en/docs/claude-code/sdk/migration-guide

万物皆可Agent！Anthropic官方“三步循环法”：手把手教你构建最强智能体与Claude Agent SDK多领域应用

万物皆可Agent！Anthropic官方“三步循环法”：手把手教你构建最强智能体

核心设计：给Claude一台电脑

创建新型智能体

构建Agent循环

第一步：收集上下文

第二步：采取行动

第三步：验证工作

测试与改进你的智能体

发表回复取消回复

最新内容

《亚洲水发展展望2025》深度解读：亚太水安全喜忧参半，未来挑战何在？

谷歌支付6800万美元和解语音助手监听诉讼，你的隐私可能被“误触发”录音

甲骨文豪掷500亿美元押注AI基建，美国数据中心版图加速扩张

OpenAI总裁豪掷2500万美元支持特朗普，科技巨头与政坛的深度捆绑引关注

相关内容

如何为AI智能体定价：挑战、模式与实践经验

Shopify Sidekick：构建生产级智能体系统的实践经验（架构演进与即时指令机制）

IBM与Anthropic强强联手：Claude AI赋能企业开发工具，效率飙升45%

谷歌大手笔投资Anthropic：AI军备竞赛全面升级

分类

快速链接

万物皆可Agent！Anthropic官方“三步循环法”：手把手教你构建最强智能体

核心设计：给Claude一台电脑

You Might Also Like

创建新型智能体

构建Agent循环

第一步：收集上下文

第二步：采取行动

第三步：验证工作

测试与改进你的智能体

发表回复 取消回复

最新内容

分类

快速链接

发表回复取消回复