OpenAI 向美国政府提前开放 GPT-5.5 进行安全测试

据路透社报道，OpenAI 首席全球事务官 Chris Lehane 在 LinkedIn 上发文透露，OpenAI 已向美国政府提前开放 GPT-5.5 模型的访问权限，供其用于国家安全测试。此次披露恰逢该公司同步推出 ChatGPT 新默认模型，与此同时，其前沿系统的网络安全能力也正面临更严格的外部审查。雅虎

GPT-5.5 宣传图

政府测试与网络安全方面的担忧

此次早期访问安排涉及美国人工智能标准与创新中心（CAISI），该机构与 OpenAI 合作，在 GPT-5.5 于 4 月 23 日正式公开发布前，对其生物学及网络安全能力进行了部署前测试。根据 OpenAI 的系统说明文件，CAISI 评估了该模型“在假设性国家安全相关场景中，是否可能为生物学专家提供技术协助”，并未发现其在国家安全相关生物学能力方面存在大幅提升。部署安全

这一举措契合了人工智能安全领域政府协调合作的更广泛行业趋势。谷歌、微软和 xAI 也计划在新 AI 模型公开发布前，通过涉及商务部 CAISI 的框架，向美国政府提供早期访问权限。据 Axios 报道，特朗普政府正另行考虑出台一项行政令，可能将测试新 AI 模型安全性的任务分配给多个联邦机构。

网络安全评估结果

英国人工智能安全研究所于4月30日发布了一份评估报告，认为GPT-5.5“可能是我们测试过的在专家级网络安全任务上表现最强的模型”。该模型在专家级挑战中的平均通过率为71.4%，而Anthropic的Mythos Preview为68.6%。在一项模拟企业网络攻击的测试中（预计人类完成需约20小时），GPT-5.5在10次试验中有2次完整完成了任务，Mythos Preview则有3次成功。

该研究所还发现了一个“通用越狱方法”，可绕过GPT-5.5对所有恶意查询的网络安全防护措施。人工智能安全研究所

新默认模型大幅减少幻觉问题

周二，OpenAI 发布 GPT-5.5 Instant，取代 GPT-5.3 Instant 成为 ChatGPT 的新默认模型。该公司表示，与前代模型相比，GPT-5.5 Instant 在医疗、法律和金融等高风险领域的提示中，幻觉内容减少了 52.5%；在用户标记为存在事实错误的对话中，不准确内容减少了 37.3%。据 OpenAI 介绍，该模型的回复也更加简洁，“多余的表情符号”也有所减少。GPT-5.3 Instant 将在三个月内继续提供，之后逐步退出使用。