Anthropic今日发布Claude Fable 5和Mythos 5。Fable 5在软件工程、知识工作、视觉和科学研究等方面超越以往所有通用模型,价格降至一半以下。同时引入新安全分类器,部分高危请求回退至Opus 4.8。Mythos 5面向网络安全合作伙伴,提供更强能力。
Anthropic 今日发布 Claude Fable 5 和 Claude Mythos 5。Fable 5 是 Mythos 级别的模型,经过安全调整后向公众开放。它的能力超越了此前所有通用模型,在软件工程、知识工作、视觉、科学研究等几乎全部基准测试中达到顶尖水平。任务越长越复杂,Fable 5 的优势就越明显。
Mythos 5 与 Fable 5 共享底层模型,但解除了部分安全限制,初期通过 Project Glasswing 与美国政府合作部署,用于网络安全防御。该模型拥有全球最强的网络安全能力。
两款模型定价均为每百万输入 token 10 美元、每百万输出 token 50 美元——不到 Mythos Preview 的一半。
软件工程:在早期测试中,Stripe 报告 Fable 5 将数月的工程压缩到数天。在一份 5000 万行 Ruby 代码库中,模型在一天内完成了原本需要整个团队两个多月的代码库迁移。在 Cognition 的 FrontierCode 评估中,Fable 5 在中级努力下即达到最高分。
知识工作:在 Hebbia 的金融基准测试中,Fable 5 在文档推理、图表解读和问题解决方面获得最高分。IMC 指出 Fable 5 几乎在所有交易分析评估中均取得完美成绩。
视觉:Fable 5 在视觉任务上达到新 SOTA,能从科学图表中精确提取数字,仅凭截图重建 Web 应用源代码。它甚至能以仅依赖视觉的极简框架玩《宝可梦 火红》并通关。
记忆与长上下文:在数百万 token 的长任务中保持专注,并利用自身笔记改进输出。在《杀戮尖塔》测试中,其表现提升幅度是 Opus 4.8 的三倍。
药物设计:内部蛋白质设计专家使用 Mythos 5 将药物设计多个步骤加速约 10 倍。模型无需人工协助即可完成科学家通常执行的整套任务:选择结合位点、运行蛋白质设计工具、失败恢复。14 个蛋白质靶点中有 9 个产生强候选分子。
分子生物学新假说:Mythos 5 能持续提出新颖且令人信服的科学假说。在盲评中,科学家约 80% 的情况下更偏好 Mythos 的假说。其中一个关于大肠杆菌蛋白的新机制已被独立研究团队验证。
基因组学新研究:Mythos 5 在超过一周的自主工作中,整合了 138 个动物物种数百万细胞的单细胞数据,设计并训练了定制机器学习模型,其性能优于最近《科学》杂志发表的模型,尽管规模小 100 倍。
对齐:自动对齐评估显示,Mythos 5 的不对齐行为(如欺骗)水平较低,与 Opus 4.8 相当。

部分早期用户测试了 Fable 5。Cursor 表示:“Fable 5 是 CursorBench 上的 SOTA 模型,解决了此前模型无法触及的长周期问题。” GitHub 评价:“它在长周期编码任务上展现出前所未有的自主性和可靠性。” Hebbia 认为:“Fable 5 的推理明显超越 Opus 4.8,达到高级研究科学家水平。”
Mythos 级模型已到达显著风险阈值。Anthropic 为 Fable 5 配备了新的分类器,用于检测潜在滥用(包括越狱尝试),当触及网络安全、生物化学或蒸馏相关请求时,模型自动回退至 Opus 4.8。初期超过 95% 的会话无需回退。
分类器覆盖以下领域:
此外,对 Mythos 级模型实施 30 天数据保留政策,仅用于安全防御,不用于训练。

现有 Mythos Preview 用户可升级至 Mythos 5,价格更低且能力相当或更强。Anthropic 计划逐步扩大合作范围,并启动面向网络安全和生物研究领域的可信访问计划。
Claude Fable 5 即日起全面可用。CLI 名称 claude-fable-5,通过 Claude API 访问。订阅用户(Pro/Max/Team/Enterprise)在 6 月 22 日前免费使用,之后需使用用量积分。预计未来恢复为订阅标准。
免费获取企业 AI 成熟度诊断报告,发现转型机会
关注公众号

扫码关注,获取最新 AI 资讯
3 步完成企业诊断,获取专属转型建议
已有 200+ 企业完成诊断