前途科技前途科技
  • 洞察
  • 服务
  • 关于
  • AI 资讯
    • 快讯
    • 产品
    • 技术
    • 商业
    • 政策
    • 初创
  • 洞察
  • 资源中心
    • 深度研究
      • AI 前沿
      • 案例研究
      • AI 知识库
    • 行业报告
      • 白皮书
      • 行业报告
      • 研究报告
      • 技术分享
      • 专题报告
    • 精选案例
      • 金融行业
      • 医疗行业
      • 教育行业
      • 零售行业
      • 制造行业
  • 服务
  • 关于
联系我们

OpenAI 向美国政府提前开放 GPT-5.5 进行安全测试

技术2026年5月6日· 原作者:AccessPath 研究院· 4 分钟阅读14 阅读

OpenAI 已向美国政府提前开放 GPT-5.5 模型,供其进行国家安全测试。同时,该模型在网络安全评估中表现强劲,但其新默认模型在减少幻觉方面有显著提升。

据路透社报道,OpenAI 首席全球事务官 Chris Lehane 在 LinkedIn 上发文透露,OpenAI 已向美国政府提前开放 GPT-5.5 模型的访问权限,供其用于国家安全测试。此次披露恰逢该公司同步推出 ChatGPT 新默认模型,与此同时,其前沿系统的网络安全能力也正面临更严格的外部审查。雅虎

GPT-5.5 宣传图

政府测试与网络安全方面的担忧

此次早期访问安排涉及美国人工智能标准与创新中心(CAISI),该机构与 OpenAI 合作,在 GPT-5.5 于 4 月 23 日正式公开发布前,对其生物学及网络安全能力进行了部署前测试。根据 OpenAI 的系统说明文件,CAISI 评估了该模型“在假设性国家安全相关场景中,是否可能为生物学专家提供技术协助”,并未发现其在国家安全相关生物学能力方面存在大幅提升。部署安全

这一举措契合了人工智能安全领域政府协调合作的更广泛行业趋势。谷歌、微软 和 xAI 也计划在新 AI 模型公开发布前,通过涉及商务部 CAISI 的框架,向美国政府提供早期访问权限。据 Axios 报道,特朗普政府正另行考虑出台一项行政令,可能将测试新 AI 模型安全性的任务分配给多个联邦机构。

网络安全评估结果

英国人工智能安全研究所于4月30日发布了一份评估报告,认为GPT-5.5“可能是我们测试过的在专家级网络安全任务上表现最强的模型”。该模型在专家级挑战中的平均通过率为71.4%,而Anthropic的Mythos Preview为68.6%。在一项模拟企业网络攻击的测试中(预计人类完成需约20小时),GPT-5.5在10次试验中有2次完整完成了任务,Mythos Preview则有3次成功。

该研究所还发现了一个“通用越狱方法”,可绕过GPT-5.5对所有恶意查询的网络安全防护措施。人工智能安全研究所

新默认模型大幅减少幻觉问题

周二,OpenAI 发布 GPT-5.5 Instant,取代 GPT-5.3 Instant 成为 ChatGPT 的新默认模型。该公司表示,与前代模型相比,GPT-5.5 Instant 在医疗、法律和金融等高风险领域的提示中,幻觉内容减少了 52.5%;在用户标记为存在事实错误的对话中,不准确内容减少了 37.3%。据 OpenAI 介绍,该模型的回复也更加简洁,“多余的表情符号”也有所减少。GPT-5.3 Instant 将在三个月内继续提供,之后逐步退出使用。

标签:OpenAI政府测试
A
AccessPath 研究院

研究团队

AccessPath AI 咨询研究团队,专注企业 AI 战略与应用研究

查看全部文章

想了解 AI 如何助力您的企业?

免费获取企业 AI 成熟度诊断报告,发现转型机会

//

24小时热榜

Google 发布 Gemini for Science 科学 AI 套件
TOP1

Google 发布 Gemini for Science 科学 AI 套件

Google DeepMind 收购 Contextual AI 人才
TOP2

Google DeepMind 收购 Contextual AI 人才

3

谷歌发布 Antigravity 2.0 开发平台

16小时前
谷歌发布 Antigravity 2.0 开发平台
4

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

19小时前
帮大家总结了一下凌晨的Google I/O 2026开发者大会。
5

Google 推出 100 美元 AI Ultra 订阅计划

16小时前
Google 推出 100 美元 AI Ultra 订阅计划
6

谷歌发布始终在线AI智能体Gemini Spark

16小时前
谷歌发布始终在线AI智能体Gemini Spark
7

法官对五角大楼AI风险标签看法分歧

16小时前
法官对五角大楼AI风险标签看法分歧
8

I/O 2026:欢迎来到智能体 Gemini 时代

19小时前
I/O 2026:欢迎来到智能体 Gemini 时代
热门标签
大模型AgentRAG微调私有化部署Prompt EngineeringChatGPTClaudeDeepSeek智能客服知识管理内容生成代码辅助数据分析金融零售制造医疗教育AI 战略数字化转型ROI 分析OpenAIAnthropicGoogle

关注公众号

前途科技微信公众号

扫码关注,获取最新 AI 资讯

免费获取 AI 落地指南

3 步完成企业诊断,获取专属转型建议

已有 200+ 企业完成诊断

前途科技前途科技
服务关于快讯技术商业报告
前途科技微信公众号

微信公众号

扫码关注

Copyright © 2026 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。|京ICP备17045010号-1|京公网安备 11010502033860号|隐私政策|服务条款