OpenAI 已向美国政府提前开放 GPT-5.5 模型,供其进行国家安全测试。同时,该模型在网络安全评估中表现强劲,但其新默认模型在减少幻觉方面有显著提升。
据路透社报道,OpenAI 首席全球事务官 Chris Lehane 在 LinkedIn 上发文透露,OpenAI 已向美国政府提前开放 GPT-5.5 模型的访问权限,供其用于国家安全测试。此次披露恰逢该公司同步推出 ChatGPT 新默认模型,与此同时,其前沿系统的网络安全能力也正面临更严格的外部审查。雅虎

此次早期访问安排涉及美国人工智能标准与创新中心(CAISI),该机构与 OpenAI 合作,在 GPT-5.5 于 4 月 23 日正式公开发布前,对其生物学及网络安全能力进行了部署前测试。根据 OpenAI 的系统说明文件,CAISI 评估了该模型“在假设性国家安全相关场景中,是否可能为生物学专家提供技术协助”,并未发现其在国家安全相关生物学能力方面存在大幅提升。部署安全
这一举措契合了人工智能安全领域政府协调合作的更广泛行业趋势。谷歌、微软 和 xAI 也计划在新 AI 模型公开发布前,通过涉及商务部 CAISI 的框架,向美国政府提供早期访问权限。据 Axios 报道,特朗普政府正另行考虑出台一项行政令,可能将测试新 AI 模型安全性的任务分配给多个联邦机构。
英国人工智能安全研究所于4月30日发布了一份评估报告,认为GPT-5.5“可能是我们测试过的在专家级网络安全任务上表现最强的模型”。该模型在专家级挑战中的平均通过率为71.4%,而Anthropic的Mythos Preview为68.6%。在一项模拟企业网络攻击的测试中(预计人类完成需约20小时),GPT-5.5在10次试验中有2次完整完成了任务,Mythos Preview则有3次成功。
该研究所还发现了一个“通用越狱方法”,可绕过GPT-5.5对所有恶意查询的网络安全防护措施。人工智能安全研究所
周二,OpenAI 发布 GPT-5.5 Instant,取代 GPT-5.3 Instant 成为 ChatGPT 的新默认模型。该公司表示,与前代模型相比,GPT-5.5 Instant 在医疗、法律和金融等高风险领域的提示中,幻觉内容减少了 52.5%;在用户标记为存在事实错误的对话中,不准确内容减少了 37.3%。据 OpenAI 介绍,该模型的回复也更加简洁,“多余的表情符号”也有所减少。GPT-5.3 Instant 将在三个月内继续提供,之后逐步退出使用。
免费获取企业 AI 成熟度诊断报告,发现转型机会
关注公众号

扫码关注,获取最新 AI 资讯
3 步完成企业诊断,获取专属转型建议
已有 200+ 企业完成诊断