新版本 Mythos AI 网络攻击模拟成功率翻倍

英国 AI 安全研究所（AISI）发布评估报告称，Anthropic 旗下 Mythos AI 的新版本在模拟网络攻击中表现出更强的能力，成功率较早期版本翻倍。这一发现引发了对 AI 网络攻防能力快速发展以及防御措施能否跟上的担忧。

进展速度超预期

AISI 在一篇题为“自主 AI 网络能力进步有多快？”的博客中指出，自 4 月首次评估以来，他们收到的新版 Mythos Preview 检查点持续改进。在研究所设计的 32 步企业网络攻击模拟中，新版本在 10 次尝试中成功 6 次，而早期版本仅成功 3 次。研究所强调，“显著的能力飞跃并不总是需要发布新模型；同一模型的后续迭代也可能显著改变我们的预估”。

该发现基于 AISI 4 月的评估，当时 Mythos 成为首个自主完成端到端模拟企业网络攻击的 AI 系统——该任务据研究所估计需要人类专家约 20 小时。AISI 如今估计，前沿网络攻击能力大约每四个月翻一番，相比 2025 年底的七个月周期有所加速。

非法访问与中方接触

在能力提升的同时，Anthropic 能否有效管控模型也受到质疑。据彭博社报道，Mythos 于 4 月发布当天，一群未经授权的用户通过第三方供应商环境中的漏洞获得了模型访问权限。Anthropic 表示没有证据显示核心系统受到影响。

另外，《纽约时报》周一报道，一名中国智库代表在上月卡内基国际和平基金会新加坡会议期间接触 Anthropic 高管，要求公司允许北京方面访问 Mythos。Anthropic 拒绝了这一请求，并已将此事告知美国国家安全委员会官员，后者对此表示担忧。

防御差距

AISI 的最新数据揭示了 AI 攻击与防御之间日益扩大的不对称性。尽管 Anthropic 于 4 月启动“Project Glasswing”计划，向苹果、微软、谷歌、亚马逊和英伟达等合作伙伴提供 Mythos 早期访问用于防御目的，但研究人员警告称，这形成了两级系统：未参与联盟的组织仍暴露于该模型的能力之下，却无法享受其防御收益。

“当这种能力广泛可用时——Anthropic 自己的员工认为将在 6 到 18 个月内实现——那些本已落后的组织不仅会退得更远，”AI 安全公司 Gray Swan 的首席产品官 Spencer Whitman 对《财富》杂志表示，“他们基于旧模型构建的程序将完全失效。”

进展速度超预期

非法访问与中方接触

防御差距