OpenAI 正式发布 GPT-5.5-Cyber,这是其旗舰模型的定制版本,专为审核通过的网络安全团队打造。该模型在漏洞识别、恶意软件分析等方面能力更强,但仅限参与“可信网络安全访问”计划的成员访问。此举距 Anthropic 发布类似模型约一个月,AI 安全竞赛持续升温。
周四,OpenAI 正式推出 GPT-5.5-Cyber——这是其旗舰模型的专属定制版本,专为经过资质审核的网络安全专业人员设计,标志着各大 AI 公司争相为数字防御者配备前沿级工具的竞赛再度升级。

根据 OpenAI 于 5 月 7 日发布的博客文章,获批团队将能够更深入地访问漏洞识别、恶意软件分析和补丁验证等工作流程——而这些内容在标准版 GPT-5.5 的安全限制下通常会受到约束。Axios报道称,该模型内部代号为"Spud",并将其描述为"GPT-5.5 的宽松版本"。
访问权限仅限于参与 OpenAI"可信网络安全访问"(TAC)计划的成员。OpenAI 表示,该计划已扩展至"数千名经过认证的防御者,以及数百支负责保护关键软件的团队"。一位发言人向Politico透露,在公开发布前,公司已向白宫、商务部人工智能标准与创新中心以及部分国会委员会进行了预览演示。获得访问权限的防御者须于 6 月 1 日前为其 ChatGPT 账户启用高级安全措施。
首席执行官 Sam Altman 于 4 月 29 日在 X 平台上发文,提前预告了此次发布:"我们将在未来几天内开始向关键网络安全防御者推出 GPT-5.5-Cyber——一款前沿网络安全模型。我们将与整个生态系统及政府合作,共同探索可信的网络安全访问机制。我们希望能迅速帮助企业和基础设施提升安全防护能力。"x
此次发布距 Anthropic 于 4 月 7 日推出 Claude Mythos Preview 仅约一个月。该模型在发现和利用软件漏洞方面能力极强,以至于 Anthropic 决定不公开发布。Anthropic 通过 Project Glasswing 进行限制访问,将该模型分发给包括 Apple、Amazon 和 Microsoft 在内的 40 余家机构。
英国人工智能安全研究所对两款模型进行了评估,发现 GPT-5.5 在专家级网络任务上的表现与 Mythos 相当,平均通过率为 71.4%,而 Mythos 为 68.6%。两款模型均成功完成了一项复杂的企业网络攻击模拟,该研究所估计,同等任务若由人类专家完成,约需 20 小时。aisi
Anthropic 网络安全政策负责人 Rob Bair 周四在 AI+Expo 上表示,Mythos 的分阶段发布旨在建立"防御方优势",并警告称:"其他前沿实验室将推出具备类似能力的模型,随后对抗性国家会将其蒸馏进其他模型……这些模型可能会被用来攻击我们。"politico
GPT-5.5-Cyber 在其前代产品 GPT-5.4-Cyber 的基础上进一步发展。后者由 OpenAI 于四月中旬发布,具备二进制逆向工程能力,并针对合法安全工作降低了拒绝响应的门槛。这一演进反映出行业内更广泛的趋势:随着前沿模型在编程和自主行动方面的能力不断增强,其网络安全潜力——无论是攻击性还是防御性——正作为通用智能提升的副产品自然涌现,而非专项训练的结果。
AI安全研究所的评估言辞直接:"如果网络攻击能力正作为长程自主性、推理和编码等通用能力提升的副产品而涌现,那么我们应当预期,未来各代模型的网络能力将进一步增强,且可能接连快速出现。"aisi
免费获取企业 AI 成熟度诊断报告,发现转型机会
关注公众号

扫码关注,获取最新 AI 资讯
3 步完成企业诊断,获取专属转型建议
已有 200+ 企业完成诊断