Anthropic 最近推出了一项名为 Skills 的新功能,该功能引发了广泛关注,并被认为是引导第三方工具形态发展的关键创新。
在对Skills的官方描述进行深入研究和实践后,其核心理念可以总结为:
Skills = 笔记式形态 + 可执行工具 + AI调度与自优化
这意味着什么?
Skills 以用户熟悉的传统笔记形式,让AI能够理解规则、调用工具执行任务,并在使用过程中实现自我优化。
形态为何如此重要
例如,在尝试学习N8N时,需要花费数小时理解可视化编程的逻辑:拖拽节点、连接流程、精确配置每个参数。这种方式本质上仍要求用户按照其特定语法进行思考,因此学习门槛较高。
然而,Skills的方式则不同。AI可以直接帮助完成手册编写并解释需求,整个过程大约仅需半小时。
这种效率上的显著差异并非源于Skills的AI更加智能,而是其形态选择的优势。
这就像学习母语和外语的区别。如果用户本来就会中文,为何要先将想法翻译成英文,再让别人理解?能用母语解决的问题,便无需强迫自己学习外语。
Skills选择了笔记这种形态:
- 文件夹分类是日常使用的习惯。
- Markdown文档,以纯文本加几个#号的形式,是目前主流的文档形态。
- 自然语言表达,无论是中文还是英文,都允许模糊的表述。
这并非一门新语言,而是用户已经掌握的知识。
形态决定了三件事
1. 门槛
采用熟悉的形态,学习成本趋近于零,无需记忆新语法、查阅文档或适应新的思维模式。
2. 表达难度
自然语言允许模糊表达,例如可以写“处理PDF文件时使用”,AI会理解;也可以写“PDF相关任务”,AI也能懂。而代码或配置语言则要求精确到每个字符。
3. 学习难度
由于不是新语言,无需翻译。用户脑海中如何思考,便可如何书写,AI能够直接理解并执行。
渐进式披露的设计哲学
从N个文档到1个文档
在进行AI编程时,经常需要同时提供4-5个文档才能清晰地说明一个任务。
例如,要分析数据,需要将:
- 数据定义文档
- 查询规则文档
- 报表格式文档
- 历史案例文档
- 注意事项文档
全部同时提供给AI。
现在,借助Skills的渐进式披露方式,AI只需查阅1个主文档(SKILL.md)。该文档会指引AI,如果需要详细的查询规则,可以去查看 resources/query-guide.md,AI会自行判断是否需要翻阅该文件。
从5个文档压缩到1个,这是用户能直接感知到的最明显变化之一。
人类使用笔记的方式
这种机制并非全新发明,而是继承了人类使用笔记的习惯:
先看目录 → 判断要不要看某章 → 再看细节
用户不会一次性将整本书摊开在桌上,而是会先看目录,判断本次任务需要第3章,然后翻开第3章。
Anthropic官方将此机制命名为渐进式披露(Progressive Disclosure),分为三层:
Level 1 元数据层
- 内容:name + description
- 作用:让AI知道有哪些能力可用
- 类比:书的封面和简介
Level 2 指令层
- 内容:SKILL.md 主文件(核心规则 + 导航)
- 作用:告诉AI这个能力如何使用
- 类比:书的目录
Level 3 资源层
- 内容:详细文档、脚本、模板
- 作用:提供具体细节和可执行工具
- 类比:书的具体章节
核心设计:代码不介入上下文
当AI需要运行一个脚本时,脚本代码不会被加载到对话上下文里,AI会直接执行,只将输出结果(例如找到3个字段:姓名、电话、地址)带回对话。
这使得Skills既能调用确定性工具(100%准确的代码),又不会因为代码本身占用大量上下文。
代码与自然语言的分工哲学
两种方案的困境
纯代码方案
- ✅ 100%精准,执行确定
- ❌ 必须穷举所有情况
例如,PDF表单的字段名可能包含“姓名”、“Name”、“客户名称”、“联系人”等。传统自动化要求为每个变体编写一条规则,否则可能导致失败。
纯自然语言方案
- ✅ 可以处理模糊性和变体
- ✅ 灵活适应新情况
LLM可以理解“客户名称”即“姓名”,但如果直接让它进行数据提取、表单填写等任务,其精确度无法得到保证。
Skills在同一个SKILL.md中结合两者
代码(100%精准) ↓ 确定性任务 ←─────────┐ (提取、计算、填写) │ ↓ │ SKILL.md ←─── Skills协调 ↑ │ 模糊判断 ←─────────┘ (字段匹配、异常处理) ↑ 自然语言(灵活处理)
协调逻辑写在SKILL.md里:
- 什么时候使用代码(确定性任务)→ 100%准确
- 什么时候使用AI(模糊判断)→ 灵活适应
- 两者无缝配合 → 准确 + 灵活
这意味着什么?
用户无需为“姓名/Name/客户名称/联系人”编写多条规则,AI会自动理解它们是同义词,但最终的提取和填写仍由代码执行,从而保证100%的准确性。
Agent自我进化
传统工具的困境:学习成本在人身上
N8N、Zapier等传统工具本身不会变得更聪明,每次优化都需要人工学习、理解并手动修改配置。工具能力固定,用户必须持续适应。
代码亦是如此,代码不会自我优化,必须由人工进行审查、重构和改进。
学习成本始终落在用户身上,并且持续高昂。
Skills的突破:AI能理解AI的反馈
其中最令人印象深刻的是双Agent自我进化机制。
传统工具的优化流程:
人学工具 → 人配置 → 人测试 → 人发现问题 → 人改配置
Skills的优化流程:
AI写手册 → AI测试 → AI发现问题 → AI反馈 → AI改进手册
关键差异: 因为Skills使用自然语言,所以AI能够理解来自AI的反馈。
两个AI在对话中完善手册,无需用户将反馈翻译成配置语言或代码语言。
角色转变:从执行者到判断者
实际使用中,双Agent优化的体验如下:
1. Agent A根据需求编写一个SKILL.md。
2. Agent B加载该手册,执行真实任务。
3. 用户观察是否存在遗漏(遗漏规则)、错误(理解错误)或效率低下(效率问题)。
4. Agent B反馈规则不够明确、缺少异常情况处理。
5. Agent A理解反馈并改进手册。
6. 重复迭代,手册变得越来越精准。
用户的角色从执行者转变为判断者,只需观察和决策,无需亲自动手实施。
这种角色转变带来的轻松感,其重要性甚至超过了速度本身的提升。
正向循环:能力越强,优化能力越强
AI能力提升 → 理解能力提升 → 反馈质量提升 → 优化精准度提升 ↑ ↓ └──────────────────────────────────────────────┘
随着AI模型自身能力的提升,它理解手册的能力更强,给出的反馈更精准,优化手册的效果也更好。
这是传统工具无法做到的,因为传统工具的能力是固定的,无论用户多么熟练,它都不会变得更聪明。
从AIos视角看Skills
AI应用的完整架构
AI应用 = AI系统 + 提示词 + 上下文 + 工具
目前这四个要素都已经成熟:
- ✅ AI系统:如Claude Sonnet 4、5等大模型
- ✅ 提示词:代码 + 自然语言
- ✅ 上下文:Skills标准化管理
- ✅ 工具:MCP协议连接外部能力
Skills在这个架构中的作用是什么?
传统提示词是“或者”关系:
自然语言(灵活但不确定) 或代码(确定但刚性)
Skills提示词则是“并且”关系:
在同一个SKILL.md中- 代码保证确定性(提取/计算/填写)- 自然语言保证灵活性(意图理解/变体处理)- Skills统一管理和调度
对标手机OS的生态
从AIos的角度看,Skills对标的是App生态:
手机OS- 系统(iOS/Android) + 应用商店(App Store) + 应用(Apps)AIos- 系统(Claude) + 插件市场(Plugins) + 技能(Skills)
Plugins是什么?
Plugins是Skills的打包和分发方式,一个Plugin可以包含多个Skills。
例如,官方的document-skills插件包包含了Excel、Word、PowerPoint、PDF等多种Skills。
官方插件包
Anthropic官方提供了两大插件包:
1. document-skills
- 包含Excel、Word、PowerPoint、PDF处理能力。
- 适合文档处理、表单填写、数据分析场景。
2. example-skills
- 包含skill-creator(创建Skills的指南)、mcp-builder(构建MCP服务器)、canvas-design(可视化设计)、algorithmic-art(算法艺术)等。
- 适合学习参考、创作工具、开发示例。
安装方式:
# 第1步添加官方插件市场/plugin marketplace add anthropics/skills# 第2步安装你需要的插件包/plugin install document-skills@anthropic-agent-skills# 第3步直接对话使用# AI会自动识别并触发相应的Skill
这些官方案例展示了Skills的完整能力:
- 笔记式规则:用自然语言编写的操作指南。
- 可执行工具:调用Python库、MCP工具、外部API。
- AI调度:自动匹配场景、按需加载资源。
如果想深入了解这些案例的具体实现,可以访问 https://github.com/anthropics/skills 查看源码和文档。
一些设计洞察
1. 被动识别 vs 主动调用
Skills的一个重要特性是被动识别,而非传统的命令式调用。
传统Command方式:
你 /weekly-reportAI 执行周报功能→ 必须记住命令名,一字不差
Skills方式:
你 写周报 / 总结本周 / 帮我整理工作AI [自动识别→触发周报Skill]→ 任何表达都可以,AI理解意图
为什么被动识别重要?
这更符合人类的自然工作方式。用户不会对同事说“/weekly-report –format=markdown”,而是会说“帮我写个周报”。
技术实现上,Command是精确字符串匹配,而Skills则是AI通过description字段理解语义,进行模糊匹配。
2. 不是让AI学习规则,而是让AI观察实践
双Claude测试法的核心原则是:
不是猜测AI需要什么,而是观察AI实际如何使用。
传统方式是人工穷举所有规则,希望覆盖所有情况,但永远无法穷尽所有边界情况。
Skills的方式是让Agent B真实使用,观察它在哪里受阻、哪里理解错误,然后让Agent A根据实际问题改进手册。
这是一种经验主义的方法,而非理性主义。
3. 形态即语言
为何笔记形态如此重要?因为形态本身就是一种语言。
当选择可视化编程(如N8N)时,就选择了节点+连线的语言。这种语言精确、确定,但也刚性、学习难度较高。
当选择代码(Python/JavaScript)时,就选择了语法+逻辑的语言。这种语言强大、灵活,但也要求用户具备编程能力。
当选择笔记(Markdown + 自然语言)时,就选择了人类思考的语言。这种语言模糊、宽松,但也是用户本来就熟悉的。
Skills的创新并非发明新语言,而是选对了语言。
三个本质
回到开头的定义:
Skills = 笔记式规则 + 可执行工具 + AI调度与自优化
现在可以更深入地理解这三个要素:
1. 笔记式规则 = 形态选择
并非发明新语言,而是采用人人都会的母语。形态决定了门槛、表达方式和迁移成本。
2. 可执行工具 = 分工哲学
代码负责确定性,AI负责灵活性。在同一个SKILL.md中无缝协调,实现“并且”而非“或者”的关系。
3. AI调度与自优化 = 学习成本转移
传统工具能力固定,需要人工单向适应。Skills让AI能够理解AI的反馈,形成自我进化的闭环,从而将学习成本从人类转移到机器。
最后一个洞察:
Skills不是工具,而是一种范式。
它并非又一个新的自动化平台,而是重新定义了如何让AI理解人类意图并执行任务。这就像Markdown并非又一个文字处理器,而是重新定义了如何用纯文本表达格式。
当理解了这个范式,会发现许多场景都可以用这种思路重构:不是教AI新语言,而是让AI说人话;不是穷举所有规则,而是让AI在实践中学习;不是单纯堆砌工具,而是让代码和AI各司其职。
这可能是AI时代的笔记革命,笔记不再只是静态知识库,而是会思考、会执行、会进化的操作系统。
