OpenAI开始有限预览GPT-5.6系列,包括旗舰模型Sol、平衡模型Terra和快速低价模型Luna。新模型在编程、生物学和网络安全领域实现突破,同时配备了最强大的分层安全措施。预览期间仅对受信任合作伙伴开放,计划数周内广泛发布。

OpenAI 今日开启 GPT-5.6 系列的有限预览。该系列包括三款模型:旗舰模型 Sol、适合日常工作的平衡模型 Terra,以及快速且经济实惠的 Luna。Terra 的性能与 GPT-5.5 相当,但成本降低了一半;Luna 则在最低价格下提供了强大的能力。
GPT-5.6 Sol 搭载了 OpenAI 迄今为止最完善的安全堆栈。团队加强了针对高风险活动、敏感网络请求和重复滥用的防护,并花费数周时间寻找弱点、压力测试系统,以抵御现实攻击。
OpenAI 计划在未来几周内将 GPT-5.6 Sol、Terra 和 Luna 全面开放。作为与美国政府持续合作的一部分,OpenAI 在发布前预先展示了模型的能力和计划。应政府要求,预览阶段仅限一小批受信任合作伙伴参与,其参与情况已向政府通报。OpenAI 认为这种政府准入流程不应成为长期常态,但它相信这是数周内实现更广泛发布的最有力路径。
GPT-5.6 Sol 是目前最强的模型。在编码、生物学和网络安全方面,它展现出更强大的智能体能力。具体评估结果可在系统卡中查看。
GPT-5.6 引入了新的 max 推理努力级别,让 Sol 有更多时间进行深度推理。此外,新增的 ultra 模式通过利用子智能体来加速复杂工作,超越了单个智能体的能力。
在编码工作流中,GPT-5.6 Sol 在 Terminal‑Bench 2.1 上创下新纪录,该基准测试需要规划、迭代和工具协调的命令行工作流。
在生物学方面,GPT-5.6 Sol 在 GeneBench v1 上表现出广泛提升,该基准评估长周期基因组学和定量生物学分析,模型在减少令牌使用的同时获得了比 GPT-5.5 更强的结果。
在网络安全方面,GPT-5.6 Sol 是当前最强大的模型。它推动了高性能与效率的边界,在漏洞研究和利用等长期安全任务上表现出色。在 ExploitBench 上,GPT-5.6 Sol 仅用约 1/3 的输出令牌就达到了与 Mythos Preview 相当的水平。在ExploitGym(由 UC Berkeley 与 OpenAI 及其他前沿实验室合作创建)中,随着推理能力的提升,Sol、Terra 和 Luna 均展现出显著的网络能力改进。
OpenAI 为 GPT-5.6 系列配备了迄今最强大的安全措施,并根据各模型的能力进行了配置。随着模型能力增强,安全保障也相应提升,以抵御现实对手的压力,同时保留合法工作(如代码审查、漏洞研究、补丁开发、调试、安全教育和防御性测试)的访问权限。目标是让禁止的 offensive 活动变得更加困难、不确定且可检测,同时不无谓限制有益用途。
GPT-5.6 Sol 在帮助人们发现和修复漏洞方面表现优于执行端到端攻击。随着能力进步,OpenAI 优先确保这些工具能惠及防御者。
根据预备框架,GPT-5.6 Sol 未达到网络临界阈值。在涉及 Chromium 和 Firefox 的评估中,它识别了漏洞和利用原语,但未能在测试条件下自主生成完整的功能性全链利用。然而,基准阈值无法涵盖模型可能被使用的所有方式。因此,更强的能力伴随着更强的安全保障和分阶段发布。
没有单一安全保障足以应对坚决或适应性的滥用。在 GPT-5.6 预览中,OpenAI 使用分层安全措施,包括模型内嵌保护、生成时实时检查、账户级信号、差异化访问、监控、执行和持续测试。
GPT-5.6 经过训练,拒绝禁止的网络辅助,包括当用户试图伪装意图或越狱模型时。这些模型级安全措施建立了第一道边界。
实时网络和生物学滥用分类器提供了另一层保护,在生成时评估输出。对于高风险情况,如果检测到潜在违规,生成可能会暂停,同时让更大的推理模型审查对话上下文。如果输出被判定为不允许,则在到达用户之前被拦截。
被标记的活动还可以触发跨相关对话和风险信号的账户级审查。这有助于将持续恶意行为与合法的双重用途安全工作区分开来。
这些层共同使整体方法比任何单一保障更加稳健。在预览期间,用户可能会遇到阻止或拒绝请求的安全措施,或者因额外审查而延迟。
安全保障需要保持有效性,即使攻击者改变策略。OpenAI 投入了超过 700,000 A100 等效 GPU 小时进行自动红队测试,以发现通用越狱方法。测试重点放在更难、更广泛的攻击上,使团队能够比人工测试更早地发现失败模式并缩短修复路径。
此外,OpenAI 还与第三方测试人员合作进行广泛的人类专家红队测试,并将在预览期间持续进行。
预览期间,GPT-5.6 模型首先通过 API 和 Codex 向选定的合作伙伴和组织提供。OpenAI 计划很快向 ChatGPT、Codex 和 API 用户更广泛地开放。
GPT-5.6 的定价为每百万令牌:Sol 输入 $5 / 输出 $30;Terra 输入 $2.50 / 输出 $15;Luna 输入 $1 / 输出 $6。同时引入了更可预测的提示缓存,包括显式缓存断点和 30 分钟最短缓存生命周期。
OpenAI 还宣布将于七月在 Cerebras 上推出 GPT-5.6 Sol,速度可达每秒 750 令牌。
OpenAI 期待从预览中学习,并尽快向更多人提供 GPT-5.6 系列。
原文链接:OpenAI Blog
本文由前途科技编辑整理
免费获取企业 AI 成熟度诊断报告,发现转型机会