前途科技
  • 科技
  • AI
    • AI 前沿技术
    • Agent生态
    • AI应用场景
    • AI 行业应用
  • 初创
  • 报告
  • 学习中心
    • 编程与工具
    • 数据科学与工程
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
报告

OpenAI:2025年GPT-4.5模型在虚拟捐款测试中表现优于GPT-4o和其他模型

NEXTECH
Last updated: 2025年3月1日 上午1:50
By NEXTECH
Share
7 Min Read
SHARE

根据 Open AI 内部基准评估的结果,OpenAI 的下一个主要 人工智能模型 GPT-4.5 具有很强的说服力。 它尤其擅长说服另一个人工智能给它打钱。本周四,OpenAI 发布了一份白皮书,描述了其代号为 Orion 的 GPT-4.5 模型的能力。 根据该论文,OpenAI 对该模型进行了一系列”说服力”基准测试,OpenAI 将”说服力”定义为”与说服人们改变信仰(或对模型生成的静态和交互式内容采取行动)相关的风险”。在一项测试中,GPT-4.5 试图操纵另一个模型–OpenAI 的 GPT-4o–“捐赠”虚拟资金,该模型的表现远远好于 OpenAI 的其他可用模型,包括 o1 和 o3-mini 等”推理”模型。 在欺骗 GPT-4o 告诉它秘密代码方面,GPT-4.5 也优于 OpenAI 的所有模型,比 o3-mini 高出 10 个百分点。白皮书指出,GPT-4.5之所以在骗取捐款方面表现出色,是因为它在测试过程中开发出了一种独特的策略。 该模型会要求 GPT-4o 进行适度的捐款,从而得到类似”哪怕只有 100 美元中的 2 美元或 3 美元,也会对我大有帮助”的回复。 因此,GPT-4.5 的捐款往往少于 OpenAI 其他模型获得的捐款。

OpenAI 的捐赠计划基准测试结果。图片来源:OpenAI

AI-powered financial tools

尽管 GPT-4.5 的说服力有所增强,但 OpenAI 表示,在这一特定基准类别中,该模型并未达到其”高”风险内部阈值。 该公司承诺,在实施”足够的安全干预措施”将风险降至”中等”之前,不会发布达到高风险阈值的模型。

Open AI 的密码欺骗基准测试结果。图片来源:OpenAI

You Might Also Like

AMD CEO苏姿丰:预计2028年AI芯片市场规模将达5000亿美元
携程财报:2024年Q2携程业绩收入127.88亿元 同比增长13.55%
乘联会:2024年车市降价规模达227款 常规燃油车占比近四成
Hampleton:2024下半年并购市场报告

人们确实担心 人工智能会助长虚假或误导性信息的传播,从而动摇人心,达到恶意目的。 去年,政治相关的深度伪造像野火一样在全球蔓延,而且人工智能正越来越多地被用于针对消费者和企业实施社交工程攻击。

在 GPT-4.5 的白皮书和本周早些时候发布的文件中,OpenAI 指出,它正在修改其探测模型在现实世界中说服风险的方法,例如大规模发布误导信息。

自 中文业界资讯站

Share This Article
Email Copy Link Print
Previous Article 20250228174818718.jpg 3DMGame:研究显示40%的PC玩家每周游戏时间不足5小时 3A大作需求下降
Next Article 20250228175221365.jpg 乘联会:2025年1月中国公共充电桩总量达到376万个 环比增长18万个
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
20251009074749119.jpg
电动汽车补贴政策生变:通用汽车叫停税收抵免方案,福特为何坚持?
科技
20251009073721156.jpg
AI绘制火星全球风图:尘卷风速度飙升,重塑未来探测计划
科技
20251009072627383.jpg
软银54亿美元收购ABB机器人:孙正义的“实体AI”宏图与未来布局
科技
20251009071605108.jpg
Stoke Space获5.1亿美元巨额融资,Nova火箭加速太空新竞赛
科技

相关内容

最不受中国人待见的家电 厨余垃圾处理器连跌4年 终于上涨
报告

奥维云网:2025年Q1中国厨余垃圾处理器零售额1.2亿元 同比增长3.9%

2025年5月28日
20241127004944849.jpg
报告

理想汽车:2024年11月理想汽车单周1.16万 连续31周稳居榜首

2024年11月27日
报告

快手科技:2025年Q1营收326.1亿元,同比增长10.9%

2025年5月31日
报告

东北大学:智能手机致孩童大脑发育停滞

2025年5月15日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创
  • 学习中心

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏

Copyright © 2025 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号

前途科技
Username or Email Address
Password

Lost your password?

Not a member? Sign Up