OpenAI 宣布开始预览 GPT-5.6 系列,包括旗舰模型 Sol、平衡模型 Terra 和经济模型 Luna。新模型在编码、生物学和网络安全任务上性能大幅提升,并配备了迄今为止最强大的分层安全防护。预览期间将先面向少量可信合作伙伴开放,随后广泛推出。
OpenAI 于 2026 年 6 月 26 日宣布,开始对 GPT-5.6 系列进行有限预览。该系列包含三款模型:旗舰款 Sol、平衡款 Terra 和经济款 Luna。Terra 的性能与 GPT-5.5 相当,但成本减半;Luna 则以最低价格提供强大能力。
GPT-5.6 Sol 是 OpenAI 迄今最强大的模型,搭载了最完善的安全堆栈。在安全方面,OpenAI 加强了对高风险活动、敏感网络请求和重复滥用的防护,并经过数周的漏洞发现、压力测试和加固。
能力方面,GPT-5.6 Sol 引入了新的“max”推理努力和“ultra”模式,后者通过子智能体加速复杂工作。在编码基准 Terminal-Bench 2.1 上达到新 SOTA;在生物学基准 GeneBench v1 上,用更少 Token 实现更强结果;在网络安全的 ExploitBench 和 ExploitGym 上,Sol 的性能与 Mythos Preview 相当,但仅消耗约三分之一输出 Token。
更强的网络能力伴随更强的防护。OpenAI 为模型配置了匹配其能力的防护措施,旨在让被禁止的进攻性活动更困难、更不确定、更可检测,同时不限制防御性用途。根据评估,GPT-5.6 Sol 未越过《预备框架》中的网络关键阈值。在 Chromium 和 Firefox 评估中,它能识别漏洞和利用原语,但未自主产生完整的全链利用。
分层安全堆栈包括:模型内训练拒绝、实时分类器、账户级审查等。实时分类器在生成时评估输出,高风险时暂停生成并由更大推理模型审查。账户级审查跨会话识别模式。
自动化红队测试方面,OpenAI 投入超过 70 万 A100 等效 GPU 小时进行自动化攻击检测,同时配合人类专家红队测试。快速响应流程用于修复新发现的越狱。
可用性与定价:预览期间通过 API 和 Codex 向部分合作伙伴开放。定价按每百万 Token:Sol 输入 5 美元/输出 30 美元;Terra 输入 2.50/输出 15;Luna 输入 1/输出 6。引入可预测提示缓存,最低缓存生命周期 30 分钟。7 月还将通过 Cerebras 推出 Sol,速度可达 750 Token/秒。
免费获取企业 AI 成熟度诊断报告,发现转型机会
关注公众号

扫码关注,获取最新 AI 资讯
3 步完成企业诊断,获取专属转型建议
已有 200+ 企业完成诊断