前途科技
  • 科技
  • AI
    • AI 前沿技术
    • Agent生态
    • AI应用场景
    • AI 行业应用
  • 初创
  • 报告
  • 学习中心
    • 编程与工具
    • 数据科学与工程
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
报告

OpenAI:2025年GPT-4.5模型在虚拟捐款测试中表现优于GPT-4o和其他模型

NEXTECH
Last updated: 2025年3月1日 上午1:50
By NEXTECH
Share
7 Min Read
SHARE

根据 Open AI 内部基准评估的结果,OpenAI 的下一个主要 人工智能模型 GPT-4.5 具有很强的说服力。 它尤其擅长说服另一个人工智能给它打钱。本周四,OpenAI 发布了一份白皮书,描述了其代号为 Orion 的 GPT-4.5 模型的能力。 根据该论文,OpenAI 对该模型进行了一系列”说服力”基准测试,OpenAI 将”说服力”定义为”与说服人们改变信仰(或对模型生成的静态和交互式内容采取行动)相关的风险”。在一项测试中,GPT-4.5 试图操纵另一个模型–OpenAI 的 GPT-4o–“捐赠”虚拟资金,该模型的表现远远好于 OpenAI 的其他可用模型,包括 o1 和 o3-mini 等”推理”模型。 在欺骗 GPT-4o 告诉它秘密代码方面,GPT-4.5 也优于 OpenAI 的所有模型,比 o3-mini 高出 10 个百分点。白皮书指出,GPT-4.5之所以在骗取捐款方面表现出色,是因为它在测试过程中开发出了一种独特的策略。 该模型会要求 GPT-4o 进行适度的捐款,从而得到类似”哪怕只有 100 美元中的 2 美元或 3 美元,也会对我大有帮助”的回复。 因此,GPT-4.5 的捐款往往少于 OpenAI 其他模型获得的捐款。

OpenAI 的捐赠计划基准测试结果。图片来源:OpenAI

AI-powered financial tools

尽管 GPT-4.5 的说服力有所增强,但 OpenAI 表示,在这一特定基准类别中,该模型并未达到其”高”风险内部阈值。 该公司承诺,在实施”足够的安全干预措施”将风险降至”中等”之前,不会发布达到高风险阈值的模型。

Open AI 的密码欺骗基准测试结果。图片来源:OpenAI

You Might Also Like

CounterPoint:苹果2024年Q4智能手机市场占据23%份额 获全球总收入54%
丰田汽车:2024年丰田亚洲龙产量达到生产峰值463台/天 累计产量突破50万台
2024 上半年国内投融资:缓慢但持续的在回升;新晋21家独角兽
Trend Micro:2025年安全预测

人们确实担心 人工智能会助长虚假或误导性信息的传播,从而动摇人心,达到恶意目的。 去年,政治相关的深度伪造像野火一样在全球蔓延,而且人工智能正越来越多地被用于针对消费者和企业实施社交工程攻击。

在 GPT-4.5 的白皮书和本周早些时候发布的文件中,OpenAI 指出,它正在修改其探测模型在现实世界中说服风险的方法,例如大规模发布误导信息。

自 中文业界资讯站

Share This Article
Email Copy Link Print
Previous Article 20250228174818718.jpg 3DMGame:研究显示40%的PC玩家每周游戏时间不足5小时 3A大作需求下降
Next Article 20250228175221365.jpg 乘联会:2025年1月中国公共充电桩总量达到376万个 环比增长18万个
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
20251228110101819.jpg
中国拟规管AI伴侣:防沉迷新规与全球监管趋势
科技
20251228103248390.jpg
阿里通义千问将主导2026年AI格局?Wired深度解析
科技
20251228100451990.jpg
OpenAI高薪55.5万美元急聘安全主管,AI安全危机何解?
科技
20251228093716882.jpg
谷歌AI眼镜2026回归,布林反思初代失败教训
科技

相关内容

报告

中微公司:2025年上半年营收49.61亿元,同比增长43.88%

2025年9月3日
百亿补贴叠加国补.JPEG
报告

淘宝启动“百亿春季补贴”每人可领1318元红包,手机家电支持与国补叠加

2025年3月5日
报告

深度洞察:生成式AI如何重塑财务职能与战略格局

2025年9月19日
20250215180014578.png
报告

韩国贸易部:2025年1月韩国科技产品出口同比下滑0.4%

2025年2月16日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创
  • 学习中心

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏

Copyright © 2025 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号

前途科技
Username or Email Address
Password

Lost your password?

Not a member? Sign Up