前途科技
  • AI
  • 初创
  • 报告
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
初创

OpenAI发布下一代推理模型o3,接近通用人工智能

NEXTECH
Last updated: 2025年1月21日 上午7:06
By NEXTECH
Share
13 Min Read
SHARE

OpenAI 发布全新推理模型 o3:迈向通用人工智能的里程碑

OpenAI 近日宣布推出其最新的 AI 推理模型 o3 和 o3-mini,旨在以更高的精度和效率解决复杂问题。这些模型代表着 AI 能力的重大飞跃,建立在 2024 年 9 月推出的 o1 系列基础之上。

o3-mini 模型作为 o3 的精简版,专为编码任务而优化,预计将于 2025 年 1 月底发布。完整的 o3 模型将在不久后推出。这两个模型目前正在进行严格的安全评估,OpenAI 邀请安全和安全研究人员参与早期测试,申请截止日期为 2025 年 1 月 10 日。

OpenAI 在 X 上发布了一篇帖子,详细介绍了这些新模型,并强调了其对安全性和可靠性的承诺。该公告强调 o3-mini 是第一个预计公开发布的版本,为开发人员和编码人员提供了对 o3 系列实际应用的了解。

通过开放早期访问申请,OpenAI 为研究人员提供了一个独特的机会,让他们在 2025 年发布之前为这些变革性的 AI 模型的完善做出贡献。

“今天,我们分享了我们 o 模型推理系列中下一个模型的早期版本的评估:OpenAI o3。”OpenAI 在 X 上表示。

今天,我们分享了我们 o 模型推理系列中下一个模型的早期版本的评估:OpenAI o3 pic.twitter.com/e4dQWdLbAD

— OpenAI (@OpenAI) 2024 年 12 月 20 日

o3 的突破性意义

o3 系列引入了突破性的“私有思维链”方法。这使得模型能够通过在生成响应之前进行内部思考和规划来模拟人类的推理过程。通过将复杂的任务分解成更小、更易于管理的步骤,o3 模型旨在提高解决问题的准确性和效率。

这种方法代表了 AI 处理推理方式的转变,优先考虑深思熟虑而不是速度。虽然这意味着响应可能需要更长时间,但权衡是更高的复杂性和准确性,即使在具有挑战性的情况下也是如此。

o3 的卓越表现

独立评估表明 o3 是 AI 推理领域的一项突破。该模型在多个基准测试中取得了前所未有的成果,包括:

  • ARC-AGI 基准测试:在高计算场景中得分 87.5%,与人类的表现水平相一致。
  • 2024 年美国数学邀请赛 (AIME):得分 96.7%,仅错了一道题。
  • 研究生级物理、化学和生物学问题 (GPQA Diamond):得分 87.7%。

作为参考,ARC-AGI 基准测试是一种用于衡量 AI 在其训练数据之外获取新技能的能力的工具。得分 85% 通常被认为与人类的表现水平相匹配。OpenAI 的 o1 模型在该基准测试中的得分在 25-32% 之间,而 o3 的得分提高了三倍,巩固了其作为下一代推理 AI 的地位。

最新消息:OpenAI 刚刚宣布推出“o3”,这是一种突破性的 AI 模型,在基准测试中显著超越了所有以前的模型。

— 在 ARC-AGI 上:o3 在低计算量上的得分是 o1 的三倍多,并且超过了 87% 的得分
— 在 EpochAI 的 Frontier Math 上:o3 创造了新的记录,解决了 25.2% 的… pic.twitter.com/mELIIFHLe5

— Rowan Cheung (@rowancheung) 2024 年 12 月 20 日

迈向通用人工智能

虽然 o3 并非通用人工智能 (AGI),但其能力模糊了先进 AI 系统与真正通用智能之间的界限。在实际场景中,它以一种通常让人难以区分于人类解决问题的精度执行任务。

这一进步引发了人们对行业、初创企业和更广泛的 AI 生态系统的影响的深刻思考。随着 o3 等 AI 模型不断突破界限,它们正在重新定义教育、研究和复杂决策等领域的可能性。

OpenAI 的 o3 系列为 AI 推理的新时代奠定了基础,其潜在应用可能会改变我们与技术的互动方式。创始人、创新者应该注意——这是一个有可能重塑行业的重大发展。

Share This Article
Email Copy Link Print
Previous Article 币安期货上线CGPT/USDT永续合约
Next Article AI聊天机器人近年來受到企業積極採用,應用領域涵蓋客服支援、潛在客戶生成以及銷售自動化。 5款免费AI聊天机器人:数字化转型新利器
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
20250615055208179.jpg
TrendForce:2025年第一季度DRAM产业营收为270.1亿美元
报告
20250615055008648.jpg
TrendForce:2025年第一季前五大NAND Flash品牌厂营收合计120.2亿美元
报告
20250615054814759.jpg
TrendForce:2025年第一季全球晶圆代工产业营收364亿美元 季减约5.4%
报告
20250615054612788.jpg
TrendForce:需求升温促使2Q25 Server与PC DDR4模组合约价涨幅扩大
报告

相关内容

初创科技

PlayFi 一周交易量达 7 万笔,将提前启动 Genesis 节点销售

2024年8月13日
Side by side photos of two men in black blazers
初创

肖恩·帕克和埃里克·施密特力挺Stability AI

2024年11月22日
初创科技

区块链气候初创公司 Raad Labs 获 CoinFund 领投 225 万美元融资

2024年8月1日
初创

OpenAI承认ChatGPT Pro亏损

2025年2月7日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
前途科技
Username or Email Address
Password

Lost your password?