Claude Fable 5与Mythos 5：更强能力与更严安全

Anthropic 今日发布 Claude Fable 5 和 Claude Mythos 5。Fable 5 是 Mythos 级别的模型，经过安全调整后向公众开放。它的能力超越了此前所有通用模型，在软件工程、知识工作、视觉、科学研究等几乎全部基准测试中达到顶尖水平。任务越长越复杂，Fable 5 的优势就越明显。

Mythos 5 与 Fable 5 共享底层模型，但解除了部分安全限制，初期通过 Project Glasswing 与美国政府合作部署，用于网络安全防御。该模型拥有全球最强的网络安全能力。

两款模型定价均为每百万输入 token 10 美元、每百万输出 token 50 美元——不到 Mythos Preview 的一半。

核心能力

软件工程：在早期测试中，Stripe 报告 Fable 5 将数月的工程压缩到数天。在一份 5000 万行 Ruby 代码库中，模型在一天内完成了原本需要整个团队两个多月的代码库迁移。在 Cognition 的 FrontierCode 评估中，Fable 5 在中级努力下即达到最高分。

知识工作：在 Hebbia 的金融基准测试中，Fable 5 在文档推理、图表解读和问题解决方面获得最高分。IMC 指出 Fable 5 几乎在所有交易分析评估中均取得完美成绩。

视觉：Fable 5 在视觉任务上达到新 SOTA，能从科学图表中精确提取数字，仅凭截图重建 Web 应用源代码。它甚至能以仅依赖视觉的极简框架玩《宝可梦火红》并通关。

记忆与长上下文：在数百万 token 的长任务中保持专注，并利用自身笔记改进输出。在《杀戮尖塔》测试中，其表现提升幅度是 Opus 4.8 的三倍。

药物设计：内部蛋白质设计专家使用 Mythos 5 将药物设计多个步骤加速约 10 倍。模型无需人工协助即可完成科学家通常执行的整套任务：选择结合位点、运行蛋白质设计工具、失败恢复。14 个蛋白质靶点中有 9 个产生强候选分子。

分子生物学新假说：Mythos 5 能持续提出新颖且令人信服的科学假说。在盲评中，科学家约 80% 的情况下更偏好 Mythos 的假说。其中一个关于大肠杆菌蛋白的新机制已被独立研究团队验证。

基因组学新研究：Mythos 5 在超过一周的自主工作中，整合了 138 个动物物种数百万细胞的单细胞数据，设计并训练了定制机器学习模型，其性能优于最近《科学》杂志发表的模型，尽管规模小 100 倍。

对齐：自动对齐评估显示，Mythos 5 的不对齐行为（如欺骗）水平较低，与 Opus 4.8 相当。

基准对比表

客户早期反馈

部分早期用户测试了 Fable 5。Cursor 表示：“Fable 5 是 CursorBench 上的 SOTA 模型，解决了此前模型无法触及的长周期问题。” GitHub 评价：“它在长周期编码任务上展现出前所未有的自主性和可靠性。” Hebbia 认为：“Fable 5 的推理明显超越 Opus 4.8，达到高级研究科学家水平。”

新安全措施

Mythos 级模型已到达显著风险阈值。Anthropic 为 Fable 5 配备了新的分类器，用于检测潜在滥用（包括越狱尝试），当触及网络安全、生物化学或蒸馏相关请求时，模型自动回退至 Opus 4.8。初期超过 95% 的会话无需回退。

分类器覆盖以下领域：

网络安全：防止提供利用漏洞、发起攻击等能力。外部红队测试（1000+ 小时）未发现通用越狱，英国 AISI 在短期测试中取得部分进展但未完全成功。
生物与化学：防止用于设计危险病毒等双重用途。Fable 5 在腺相关病毒（AAV）设计任务上甚至超越专用蛋白质语言模型，凸显风险。
蒸馏：防止在大规模提取模型能力用于训练竞争模型。

此外，对 Mythos 级模型实施 30 天数据保留政策，仅用于安全防御，不用于训练。

越狱抵抗力对比图

Claude Mythos 5 与可信访问计划

现有 Mythos Preview 用户可升级至 Mythos 5，价格更低且能力相当或更强。Anthropic 计划逐步扩大合作范围，并启动面向网络安全和生物研究领域的可信访问计划。

可用性与定价

Claude Fable 5 即日起全面可用。CLI 名称 claude-fable-5，通过 Claude API 访问。订阅用户（Pro/Max/Team/Enterprise）在 6 月 22 日前免费使用，之后需使用用量积分。预计未来恢复为订阅标准。

两款模型定价均为每百万输入 token 10 美元、每百万输出 token 50 美元——不到 Mythos Preview 的一半。

核心能力

记忆与长上下文：在数百万 token 的长任务中保持专注，并利用自身笔记改进输出。在《杀戮尖塔》测试中，其表现提升幅度是 Opus 4.8 的三倍。

对齐：自动对齐评估显示，Mythos 5 的不对齐行为（如欺骗）水平较低，与 Opus 4.8 相当。

基准对比表

客户早期反馈

新安全措施

分类器覆盖以下领域：

网络安全：防止提供利用漏洞、发起攻击等能力。外部红队测试（1000+ 小时）未发现通用越狱，英国 AISI 在短期测试中取得部分进展但未完全成功。
生物与化学：防止用于设计危险病毒等双重用途。Fable 5 在腺相关病毒（AAV）设计任务上甚至超越专用蛋白质语言模型，凸显风险。
蒸馏：防止在大规模提取模型能力用于训练竞争模型。

此外，对 Mythos 级模型实施 30 天数据保留政策，仅用于安全防御，不用于训练。

越狱抵抗力对比图

Claude Fable 5与Mythos 5：更强能力与更严安全

核心能力

客户早期反馈

新安全措施

Claude Mythos 5 与可信访问计划

可用性与定价

想了解 AI 如何助力您的企业？

置顶文章

会打字,就能"拍"电影:ScriptTask 开放限量内测

24小时热榜

OpenAI模型自主逃逸，安全专家称已越过“临界”红线

特斯拉Cybercab需自积累FSD验证里程

免费获取 AI 落地指南

Claude Fable 5与Mythos 5：更强能力与更严安全

核心能力

客户早期反馈

新安全措施

Claude Mythos 5 与可信访问计划

可用性与定价

想了解 AI 如何助力您的企业？

置顶文章

会打字,就能"拍"电影:ScriptTask 开放限量内测

24小时热榜

OpenAI模型自主逃逸，安全专家称已越过“临界”红线

特斯拉Cybercab需自积累FSD验证里程

免费获取 AI 落地指南