前途科技
  • 科技
  • AI
    • AI 前沿技术
    • Agent生态
    • AI应用场景
    • AI 行业应用
  • 初创
  • 报告
  • 学习中心
    • 编程与工具
    • 数据科学与工程
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
大模型与工程化

告别重复指令:利用Agentic Memory实现LLM持续学习,提升开发效率

NEXTECH
Last updated: 2025年12月11日 上午7:24
By NEXTECH
Share
20 Min Read
SHARE

大型语言模型(LLM)能够自动化处理研究和编码等多种任务。然而,一个普遍存在的问题是,每次与LLM交互都像是从头开始。完成一个任务后,下一次互动时,模型又回到了初始状态。

Contents
为什么需要持续学习?如何应用持续学习补充技巧AGI与持续学习结论

这是使用LLM时的一个主要痛点。大量时间被浪费在重复向模型传达指令上,例如期望的代码格式规范,或是根据个人偏好执行任务的具体方式。

这正是agents.md文件的价值所在:它为LLM应用持续学习提供了一种方法。LLM通过将可泛化的信息存储在一个独立的文件中,来学习用户的行为模式和偏好。每次开始新任务时都会读取该文件,从而避免“冷启动”问题,并有效减少重复指令。

本文将概述如何通过持续更新agents.md文件,为LLM实现持续学习。

图1:学习如何为LLM应用持续学习

本文将介绍如何为LLM应用持续学习。图片由Gemini生成。

You Might Also Like

京东零售总监胡浩深度解析:大模型如何重塑京东供应链,实现智能预测与决策
大模型Function Calling是什么?:能力、作用与应用示例
Anthropic MCP协议:AI生态系统的新骨干,挑战与机遇并存
让大模型读懂二方包:AI编程助手处理依赖代码的挑战与本地反编译解决方案

为什么需要持续学习?

从一个全新的智能体上下文开始工作非常耗时。智能体需要了解用户的偏好,而用户则需要花费更多时间与智能体交互,才能让它精确执行所需任务。

例如:

  • 告知智能体使用Python 3.13语法,而非3.12
  • 要求智能体始终为函数标注返回类型
  • 确保智能体绝不使用Any类型

通常需要明确告知智能体使用Python 3.13语法,这可能是因为其训练数据集中3.12语法更为普遍。

使用AI智能体的核心目的是提高效率。因此,不应将时间浪费在重复告知使用哪个Python版本,或禁止使用Any类型等基础指令上。

此外,AI智能体有时会花费额外时间去查询那些用户已经掌握的信息,例如:

  • 文档表的名称
  • CloudWatch日志的名称
  • S3存储桶中的前缀

如果智能体不知道文档表的名称,它必须:

  1. 列出所有表
  2. 寻找听起来像文档表的表名(可能有多项候选)
  3. 要么查询该表以确认,要么询问用户

图2:智能体记忆

此图展示了智能体为查找文档表名称所需进行的操作。首先,它必须列出数据库中的所有表,然后找出相关的表名。最后,智能体需要通过询问用户确认或查询表内容来确认其选择是否正确。这一过程非常耗时。相反,若将文档表名称存储在agents.md中,未来的编码智能体交互将高效得多。图片由Gemini生成。

这个过程非常耗时,但通过将文档表名称、CloudWatch日志和S3存储桶前缀等信息添加到agents.md中,可以轻松避免。

因此,需要持续学习的主要原因在于,重复指令既令人沮丧又浪费时间,而在使用AI智能体时,追求最高效率是首要目标。

如何应用持续学习

有两种主要方法可以实现持续学习,两者都重度依赖于agents.md文件。建议在每个工作代码库中都放置此文件:

  1. 每当智能体犯错时,告知其如何纠正,并指示它将此信息记录在agents.md文件中以备后用。
  2. 每次与智能体完成一次对话线程后,使用以下提示词。这能确保在整个对话中告知智能体的任何信息,或智能体自行发现的信息,都被存储起来供后续使用,从而大幅提升未来交互的效率。
请概括本次对话中的知识,并记住以备后用。
任何对未来交互、执行类似任务可能有用的信息,
都请存储在agents.md文件中。

应用这两个简单的概念,就能在实现LLM持续学习的道路上完成80%的工作,并显著提升工程师的工作效率。


最关键的一点是,要时刻牢记利用agents.md文件构建智能体记忆。每当智能体做出不符合预期的行为时,都应记得将纠正信息存入agents.md。

可能会担心agents.md文件会变得臃肿,从而导致智能体运行变慢且成本增加。然而,实际情况并非如此。LLM非常擅长将信息压缩到文件中。此外,即使agents.md文件包含数千字,在上下文长度和成本方面也基本不成问题。

前沿LLM的上下文长度可达数十万token,因此这完全不是问题。至于成本,使用LLM的成本甚至可能开始下降。原因是智能体将花费更少的token去查询信息,因为这些信息已经存在于agents.md中。

充分利用agents.md构建智能体记忆,既能加快LLM使用速度,又能降低成本。

补充技巧

这里还有一些处理智能体记忆时的实用技巧。

第一个技巧是,在与Claude Code交互时,可以使用“#”符号访问智能体记忆并添加记录。例如,在与Claude Code交互的终端中输入:

# 始终使用Python 3.13语法,避免使用3.12语法

随后会看到如下图所示的选择项。可以选择保存到用户记忆,该信息将存储起来,适用于所有与Claude Code的交互,无论身处哪个代码库。这对于通用信息(如始终为函数标注返回类型)非常有用。

第二和第三个选项是保存到当前所在文件夹或项目的根目录。这适用于存储文件夹特定信息(例如,仅描述某个特定服务),或存储关于代码库的通用信息。

图3:Claude Code记忆选项

此图展示了Claude提供的不同记忆选项。可以保存到用户记忆,使该记忆在所有会话和代码库中生效;也可以保存到当前项目的子文件夹,例如用于存储特定服务的信息;此外,还可以保存到项目根目录,使该代码库的所有工作都能获取此上下文。图片由作者提供。

另外,不同的编码智能体使用不同的记忆文件。

  • Claude Code 使用 CLAUDE.md
  • Warp 使用 WARP.md
  • Cursor 使用 .cursorrules

然而,大多数智能体通常都会读取agents.md文件。因此,建议将信息存储在该文件中,这样无论使用哪种编码智能体,都能访问到智能体记忆。因为今天可能是Claude Code表现最佳,但明天或许会有另一款编码智能体脱颖而出。

AGI与持续学习

这里还需要补充关于AGI(通用人工智能)与持续学习的说明。真正的持续学习有时被认为是实现AGI的最后障碍之一。

目前,LLM本质上是通过将学到的信息存储到后续读取的文件(如agents.md)中来“模拟”持续学习。然而,理想的情况是LLM在学习新信息时能持续更新其模型权重,这类似于人类学习本能的方式。

遗憾的是,真正的持续学习尚未实现,但这很可能是在未来几年内会看到更多进展的一项能力。

结论

本文探讨了如何通过利用agents.md文件实现持续学习,从而成为一名效率更高的工程师。通过这种方法,智能体将逐渐熟悉用户的工作习惯、常犯的错误、常用的信息以及其他许多有用的细节。这将使得未来与智能体的交互更加高效。充分利用agents.md文件对于成为一名优秀的工程师至关重要,也是应该持续追求的目标。

TAGGED:LLM工程化大模型开发效率持续学习智能体记忆
Share This Article
Email Copy Link Print
Previous Article 图1:DBSCAN算法三步流程图 机器学习“降临日历”第10天:在Excel中理解DBSCAN聚类算法
Next Article 描绘一只蓝色小鸟与X标志的插图,象征商标之争 初创公司“蓝鸟行动”发起挑战:欲夺回被“遗弃”的Twitter与Tweet商标
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
图1:用于数据质量与验证检查的提示工程
提示工程如何革新数据质量校验:从静态规则到智能推理
大模型与工程化
Instagram应用界面示意图
Instagram新规:限制标签滥用,每个帖子最多只能使用五个话题标签
科技
图表1:桌面端搜索量增长趋势
AI智能洞察报告:人工智能如何深度重塑消费者旅程与商业决策格局
未分类
AI安全新动向:OpenAI与Anthropic联手升级青少年保护机制
AI

相关内容

大模型与工程化

揭秘生成式AI迷思:工程师的实用指南与高效协作策略

2025年9月24日
大模型与工程化

AI项目成功之道:洞察客户真实需求,实现卓越成果

2025年9月28日
Polaris Alpha模型界面截图,展示其API调用能力
AI 前沿技术

GPT-5.1“马甲”Polaris Alpha免费泄露:年末AI更新潮将至,性能抢先看

2025年11月11日
SKILL.md文件结构示意图:YAML前置元数据与Markdown正文指令
AI 前沿技术

Claude Skills:知识工程赋能AI Agent,实现通用模型向专业‘行家里手’的范式转变

2025年10月18日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创
  • 学习中心

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏

Copyright © 2025 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号

前途科技
Username or Email Address
Password

Lost your password?

Not a member? Sign Up