前途科技
  • 科技
  • AI
    • AI 前沿技术
    • Agent生态
    • AI应用场景
    • AI 行业应用
  • 初创
  • 报告
  • 学习中心
    • 编程与工具
    • 数据科学与工程
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
Agent生态

万物皆可Agent!Anthropic官方“三步循环法”:手把手教你构建最强智能体与Claude Agent SDK多领域应用

NEXTECH
Last updated: 2025年10月13日 上午6:26
By NEXTECH
Share
28 Min Read
SHARE

万物皆可Agent!Anthropic官方“三步循环法”:手把手教你构建最强智能体

Anthropic在推出Claude Sonnet 4.5时,正式发布了Claude Agent SDK。该SDK旨在帮助开发者在Claude上构建功能强大的自主智能体。实际上,Claude Agent SDK的前身是为支持内部开发效率而生的Claude Code SDK。但在过去数月,其应用早已超越了编码范畴,在Anthropic内部被广泛用于深度研究、视频创作、笔记整理等各种非编程任务,并已成为几乎所有主要智能体循环(Agent Loops)的动力核心。为了体现其更广泛的应用前景,Anthropic决定将其正式更名为Claude Agent SDK。本文将深入解读Anthropic构建该SDK的初衷、如何使用它来打造自己的智能体,以及团队在实际部署中总结出的最佳实践。

核心设计:给Claude一台电脑

Claude Agent SDK背后的核心设计原则非常直接:Claude需要和程序员一样,拥有相同的日常工具。

这意味着,智能体需要能够在代码库中查找文件、编写和编辑文件、进行代码检查(lint)、运行、调试,并在此过程中不断迭代直至成功。

Anthropic团队发现,通过终端给予Claude访问用户计算机的权限,它就获得了像程序员一样编写代码所需的一切。

更重要的是,这也使得Claude在处理非编码任务时同样高效。通过运行bash命令、编辑、创建和搜索文件,Claude能够读取CSV文件、搜索网页、构建可视化图表、解读指标等,胜任各类数字工作——简而言之,成为一个拥有计算机的通用智能体。

让智能体像人类一样使用计算机工作,这正是Claude Agent SDK的关键设计理念。

You Might Also Like

Claude Skills:革新AI任务处理,超越MCP协议的Agent新范式
2025 Agent热潮:语料如何赋能AI落地与ISV变现,解析其关键作用与发展阶段
Anthropic联合创始人杰克·克拉克:AI的真实恐惧与未来思考
AI Agent:实习生的终结者,下场的从业者的和看台上的观众

创建新型智能体

Anthropic相信,为Claude配备一台“电脑”,能够解锁过去难以有效实现的智能体能力。利用该SDK,开发者可以构建:

  • 金融智能体:理解投资组合和目标,通过访问外部API、存储数据和运行代码来帮助评估投资。
  • 个人助理智能体:连接内部数据源,跨应用追踪上下文,帮助预订差旅、管理日历、安排会议、整理简报等。
  • 客户支持智能体:处理高模糊性的用户请求(如客服工单),通过收集和审查用户数据、连接外部API、回复用户,并在必要时将问题升级给人类。
  • 深度研究智能体:在大型文档集合中进行全面研究,通过搜索文件系统、分析和综合多源信息、交叉引用数据,并生成详细报告。

其核心是,该SDK提供了构建智能体所需的基础模块,以自动化任何所需的工作流。

构建Agent循环

在实践中,Claude通常遵循一个特定的反馈循环进行操作:收集上下文 → 采取行动 → 验证工作 → 重复。

Claude Agent循环示意图

这个循环为思考如何构建其他类型的智能体以及应赋予它们何种能力,提供了一个有效的框架。接下来,文章将以构建一个邮件智能体为例,逐步拆解这个过程。

第一步:收集上下文

开发智能体时,不能只给它一个提示,而是要让它能够获取并更新自己的上下文。

智能体搜索与文件系统

文件系统代表了可以被模型调用的潜在信息。当遇到日志等大文件时,Claude会自行决定使用grep、tail等bash脚本来加载最相关的部分。本质上,智能体的文件夹和文件结构本身,就成为了一种上下文工程。例如,邮件智能体可以将过去的对话存储在名为'Conversations'的文件夹中,以便在需要时进行搜索。

子智能体 (Subagents)

SDK默认支持子智能体。其优势有二:一是并行化,可以同时启动多个子智能体处理不同任务;二是上下文管理,子智能体在隔离的上下文中工作,只将相关信息返回给主控者,非常适合处理需要从海量信息中筛选少量有用数据的任务。例如,邮件智能体可以并行启动多个“搜索子智能体”,分别查询邮件历史,并只返回相关的邮件摘要。

压缩 (Compaction)

当智能体长时间运行时,上下文维护至关重要。当接近上下文窗口限制时,SDK的compact功能会自动总结之前的消息,确保智能体不会耗尽上下文空间。

语义搜索

语义搜索虽然速度通常比智能体搜索快,但准确性较低,且维护更困难、透明度更差。Anthropic建议从智能体搜索开始,仅在需要更快速度或更多样化结果时才引入语义搜索。

第二步:采取行动

收集完上下文后,你需要为智能体提供灵活的行动方式。

工具 (Tools)

工具是智能体执行任务的主要构建模块。它们在Claude的上下文窗口中非常突出,是模型决定如何完成任务时优先考虑的选项。因此,你需要精心设计工具以最大化上下文效率。例如,为邮件智能体定义"fetchInbox"或"searchEmails"等核心工具。

Bash与脚本

Bash作为一个通用工具,能让智能体灵活地使用计算机。例如,邮件智能体可以编写代码来下载邮件附件(如PDF),将其转换为文本,然后搜索其中的关键词(如“invoice”)。

pdftotext document.pdf - | grep -n "invoice" | tail -10

代码生成

Claude Agent SDK擅长代码生成。代码具有精确、可组合和可复用的特性,是执行复杂操作的理想选择。例如,Claude.ai中创建Excel、PPT和Word文档的功能,完全依赖于生成Python脚本来实现。对于邮件智能体,可以生成代码,为收到的邮件创建自动化规则:

async function onEmailReceived(email) {
    const isFromCustomer = email.from.includes('@customer.com') || /* ... */;
    if (!isFromCustomer) return;

    const isEmailUrgent = await askLLM(`Does this email seem urgent: ${renderEmail(email)}, return TRUE OR FALSE`);

    if (isEmailUrgent === "TRUE" && isFromCustomer) {
        forwardEmail(email, { to: 'teamlead@company.com' });
        createTask({ title: `Urgent: Respond to ${email.from}` });
    }
}

MCPs (模型上下文协议)

Model Context Protocol (MCP) 提供了与外部服务的标准化集成,能自动处理身份验证和API调用。这意味着你可以轻松将智能体连接到Slack、GitHub、Google Drive或Asana等工具,无需编写自定义集成代码或管理OAuth流程。

第三步:验证工作

智能体循环的最后一步是评估其工作。能够检查并改进自身输出的智能体更加可靠。关键在于给予Claude评估工作的具体方法。

定义规则

最有效的反馈形式是提供明确的输出规则,并在规则未被满足时解释原因。代码检查(Code linting)就是一个典型的基于规则的反馈。例如,生成TypeScript并对其进行检查,通常比直接生成纯JavaScript更好,因为它提供了更多层次的反馈。

视觉反馈

在处理UI生成或测试等视觉任务时,截图或渲染图形式的视觉反馈非常有帮助。例如,在生成HTML格式的邮件后,可以将其截图并返回给模型进行视觉验证,检查布局、样式、内容层级、响应性等是否符合要求。使用像Playwright这样的MCP服务器,可以自动化整个视觉反馈循环。

LLM作为评判者

你也可以让另一个语言模型根据模糊的规则来“评判”智能体的输出。这种方法通常不够稳健,且会带来延迟,但对于追求极致性能的应用场景可能有所帮助。例如,让一个子智能体来判断邮件草稿的语气是否与用户之前的沟通风格一致。

测试与改进你的智能体

在多次迭代智能体循环后,你需要对其进行测试,确保它能胜任任务。最好的改进方法是仔细检查其输出,尤其是在失败的案例中,并设身处地思考:它是否拥有完成这项工作的合适工具?

以下是一些评估时可以自问的问题:

  • 如果智能体误解了任务,是否缺少关键信息?能否调整搜索API的结构,让它更容易找到所需内容?
  • 如果智能体在某个任务上反复失败,能否在工具调用中添加一个正式规则来识别和修复该失败?
  • 如果智能体无法修复自己的错误,能否提供更有用或更有创意的工具来解决问题?
  • 如果智能体的性能随着功能增加而波动,是否应根据客户使用情况构建一个代表性的测试集,进行程序化评估?

具体操作请参阅官方文档:

https://docs.claude.com/en/docs/claude-code/sdk/migration-guide

TAGGED:Agent生态AnthropicClaude Agent SDK三步循环法智能体开发
Share This Article
Email Copy Link Print
Previous Article 黑莓信使:短信自由化之路 BBM:黑莓信使如何开启短信自由时代
Next Article Docling:RAG数据秒级转换解决方案,彻底解决数据准备难题及实战部署指南
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
20251205183721458.jpg
南部非洲古人类基因组改写进化史:20万年隔离与独特基因
科技
20251205180959635.jpg
AMD为对华出口AI芯片支付15%税费,引发美国宪法争议
科技
20251205174331374.jpg
家的定义与核心价值:探索现代居住空间的意义
科技
20251202135921634.jpg
英伟达20亿美元投资新思科技,AI芯片设计革命加速
科技

相关内容

auto-coder.chat 模型列表显示截图
Agent生态

SubAgents:多模型融合与成本极致压缩的AI编程实践

2025年11月2日
五大Agent角色划分的拆解策略
Agent生态

AI驱动支付提效40%:一键接入系统技术架构与大模型优化实践

2025年10月11日
Agent生态未分类

从企业AI SaaS到个人设计助手:Agent实践经验揭示,普通人与大厂站在同一起跑线

2025年10月16日
Agent生态

Dify能做什么?深入解析其定位、价值、应用场景及挑战

2025年11月6日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创
  • 学习中心

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏

Copyright © 2025 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号

前途科技
Username or Email Address
Password

Lost your password?

Not a member? Sign Up