前途科技前途科技
  • 洞察
  • 服务
  • 关于
  • AI 资讯
    • 快讯
    • 产品
    • 技术
    • 商业
    • 政策
    • 初创
  • 洞察
  • 资源中心
    • 深度研究
      • AI 前沿
      • 案例研究
      • AI 知识库
    • 行业报告
      • 白皮书
      • 行业报告
      • 研究报告
      • 技术分享
      • 专题报告
    • 精选案例
      • 金融行业
      • 医疗行业
      • 教育行业
      • 零售行业
      • 制造行业
  • 服务
  • 关于
联系我们

OpenAI 发布全新模型 O3 和 O3-mini

洞察2025年1月21日· 5 分钟阅读10 阅读

OpenAI 推出全新推理模型 o3 和 o3 mini,代码能力超越人类 OpenAI 正在逐步向精选用户开 […]

OpenAI 推出全新推理模型 o3 和 o3 mini,代码能力超越人类

OpenAI 正在逐步向精选用户开放其全新推理模型 o3 和 o3 mini 的测试权限。这两个模型是此前已全面发布的 o1 和 o1 mini 的继任者。

OpenAI 首席执行官 Sam Altman 在“OpenAI 十二天”直播活动的最后一天宣布了 o3 系列模型的发布,并表示它们将首先提供给第三方研究人员进行安全测试。

Altman 还强调 o3 模型在代码方面表现“令人难以置信”,OpenAI 分享的基准测试结果也证实了这一点,o3 在编程任务上的表现甚至超越了 o1。

o3 模型在多个领域展现出卓越的能力:

  • 代码能力:在 SWE-Bench Verified 上,o3 比 o1 高出 22.8 个百分点,并在 Codeforces 上获得了 2727 的评分,超过了 OpenAI 首席科学家的 2665 分。
  • 数学和科学:o3 在 2024 年 AIME 考试中获得了 96.7% 的分数,仅错了一道题,并在 GPQA Diamond 上获得了 87.7% 的分数,远远超过了人类专家的表现。
  • 前沿基准测试:o3 在 EpochAI 的 Frontier Math 等具有挑战性的测试中创下了新纪录,解决了 25.2% 的问题,而其他模型的解决率不超过 2%。在 ARC-AGI 测试中,o3 的得分是 o1 的三倍,超过了 85%(经 ARC Prize 团队现场验证),标志着概念推理能力的里程碑。

除了这些进步,OpenAI 还重申了其对安全性和一致性的承诺。

该公司发布了关于“审慎对齐”的新研究,这项技术是使 o1 成为迄今为止最稳健和最一致的模型的关键因素。

这项研究也将对 o3 和 o3-mini 的对齐工作起到关键作用,确保其能力既强大又负责任。

目前,OpenAI 网站已开放早期访问申请,申请截止日期为 2025 年 1 月 10 日。

申请者需要填写一份在线表格,提供各种信息,包括先前发表论文的链接、GitHub 上的代码库链接,以及他们希望测试的模型(o3 或 o3-mini)以及使用这些模型的计划。

被选中的研究人员将获得 o3 和 o3-mini 的访问权限,以探索其功能并参与安全评估,但 OpenAI 的表格提醒称,o3 将在几周后才能使用。

研究人员被鼓励开发稳健的评估方法,创建高风险能力的受控演示,并在广泛采用的工具无法实现的场景中测试模型。

这项举措建立在该公司既定的实践基础上,包括严格的内部安全测试、与美国和英国人工智能安全研究所等组织的合作,以及其准备框架。

申请流程要求提供研究重点、过往经验以及先前工作的链接。OpenAI 将滚动审查申请,从即日起开始选拔。

o3 和 o3-mini 的推出标志着人工智能性能的飞跃,特别是在需要高级推理和解决问题能力的领域。

这些模型在代码、数学和概念基准测试中取得了非凡的成果,突显了人工智能研究的快速进展。

通过邀请更广泛的研究界参与安全测试,OpenAI 旨在确保这些能力得到负责任的部署。

观看下面的直播视频:

想了解 AI 如何助力您的企业?

免费获取企业 AI 成熟度诊断报告,发现转型机会

//

24小时热榜

Anthropic CEO呼吁联邦有权阻止危险AI模型
TOP1

Anthropic CEO呼吁联邦有权阻止危险AI模型

OpenAI 收购云平台 Ona,为 AI 智能体打造安全开发环境
TOP2

OpenAI 收购云平台 Ona,为 AI 智能体打造安全开发环境

3

Anthropic 投 2 亿美元研究 AI 失业

21小时前
Anthropic 投 2 亿美元研究 AI 失业
4

Google称YouTube条款允许用上传音乐训练AI

21小时前
Google称YouTube条款允许用上传音乐训练AI
5

谷歌发布实时语音翻译,覆盖70多种语言

21小时前
谷歌发布实时语音翻译,覆盖70多种语言
6

线粒体为细胞核提供专属能量专线

21小时前
线粒体为细胞核提供专属能量专线
7

OpenAI封禁涉华虚假信息账号

21小时前
OpenAI封禁涉华虚假信息账号
8

研究发现人类走路偏向逆时针

21小时前
研究发现人类走路偏向逆时针
热门标签
大模型AgentRAG微调私有化部署Prompt EngineeringChatGPTClaudeDeepSeek智能客服知识管理内容生成代码辅助数据分析金融零售制造医疗教育AI 战略数字化转型ROI 分析OpenAIAnthropicGoogle

关注公众号

前途科技微信公众号

扫码关注,获取最新 AI 资讯

免费获取 AI 落地指南

3 步完成企业诊断,获取专属转型建议

已有 200+ 企业完成诊断

前途科技前途科技
服务关于快讯技术商业报告
前途科技微信公众号

微信公众号

扫码关注

Copyright © 2026 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。|京ICP备17045010号-1|京公网安备 11010502033860号|隐私政策|服务条款