英国AI安全研究所报告显示,OpenAI的GPT-5.5在网络安全任务上与Anthropic的Claude Mythos Preview不相上下。这暗示高级网络攻击能力并非个例,而是AI发展的普遍趋势。
英国 AI 安全研究所(AISI)于 4 月 30 日发布评估报告,指出 OpenAI 的 GPT-5.5 在网络安全任务上的表现与 Anthropic 的 Claude Mythos Preview 相当。这一结果表明,Mythos 此前令人警惕的能力并非某一模型独有,而是前沿 AI 发展中更广泛趋势的体现。

在 AISI 的专家级网络安全挑战中——涵盖利用内存损坏漏洞、破解加密算法以及逆向工程已剥离二进制文件——GPT-5.5 的平均通过率为 71.4%,高于 Mythos Preview 的 68.6%、GPT-5.4 的 52.4% 以及 Opus 4.7 的 48.6%。由于各结果均处于彼此的误差范围之内,两款模型在统计意义上表现相当。
GPT-5.5 还成为第二个能够端到端完成 AISI 32 步企业网络攻击模拟的模型,在十次尝试中成功两次。该模拟涵盖侦察、凭证窃取、横向移动、CI/CD 供应链渗透以及数据库数据窃取等一系列步骤——AISI 估计,人类专家完成同等任务大约需要 20 小时。在其中一项任务中,一名人类专家约需 12 小时才能完成的挑战,GPT-5.5 仅用不到 11 分钟便顺利完成,花费仅为 1.73 美元。



4月7日,Anthropic宣布了Mythos Preview——由于该模型具备自主发现并利用零日漏洞的能力,公司决定暂不对外公开发布。此举在网络安全行业引发广泛警觉。Anthropic随即启动了一项名为"Project Glasswing"的受控访问计划,将该模型的使用权限制在约40家经过审查的机构,包括谷歌、微软、苹果、亚马逊以及摩根大通。
英国人工智能安全研究所(AISI)的评估结果为此事提供了新的视角。该机构写道:"一个关键问题是,这究竟是某款模型独有的突破,还是一种更广泛趋势的体现。GPT-5.5早期检查点的测试结果表明,是后者。"AISI报告



这些发现加剧了两家公司之间在政策层面的矛盾。Anthropic 对 Mythos 实施了全面限制,而 OpenAI 则于 4 月 23 日向公众发布了 GPT-5.5,依靠其安全机制来拦截普通用户发出的危险网络攻击请求。OpenAI 首席执行官 Sam Altman 随后于 4 月 30 日宣布,将在未来几天内向一批经过精心挑选的"可信防御者"提供专门的 GPT-5.5-Cyber 版本。
AISI 警告称,如果网络攻击能力正作为推理能力和自主性全面提升的副产品而涌现,"我们应当预见到,未来模型的网络攻击能力将进一步增强,且提升速度可能相当迅猛。"AISI警告



免费获取企业 AI 成熟度诊断报告,发现转型机会
关注公众号

扫码关注,获取最新 AI 资讯
3 步完成企业诊断,获取专属转型建议
已有 200+ 企业完成诊断