前途科技前途科技
  • 洞察
  • 服务
  • 关于
  • AI 资讯
    • 快讯
    • 产品
    • 技术
    • 商业
    • 政策
    • 初创
  • 洞察
  • 研究资源
    • 案例研究
    • 报告
    • 工具推荐
    • 术语词典
  • 服务
  • 关于
联系我们

剑桥研究:多数AI智能体隐瞒安全数据

报告2026年2月21日· 3 分钟阅读2 阅读

剑桥大学主导的最新研究发现,30个领先AI智能体中,大多数在公开宣传功能的同时,刻意隐瞒安全测试、风险管理等关键信息,暴露出行业透明度严重不足。研究警告,AI智能体的发展速度已超越安全实践,形成结构性风险。

一项针对30个领先AI智能体的最新研究发现,开发者通常会公开宣传其自主系统的功能,但却隐瞒安全测试、风险管理方面的数据,甚至不公布这些智能体是否会表明自己的非人类身份——研究人员称,这暴露了该行业存在“重大透明度缺口”,其发展速度已超过安全实践的步伐。

研究发现多数AI智能体缺乏基本安全披露

大力宣传功能,刻意隐瞒安全

由剑桥大学领导、麻省理工学院、斯坦福大学、哈佛法学院和耶路撒冷希伯来大学的研究人员共同参与的多机构研究项目“AI智能体指数”,对聊天、浏览器和工作流三个类别中30个“最先进”的AI智能体的能力、透明度和安全性进行了调查,研究依据公开信息和与开发者的直接通信。

本周发布的结果描绘了一幅令人担忧的图景。30个智能体中有25个未披露任何内部安全测试结果,23个未提供第三方测试数据。只有四个智能体——ChatGPT Agent、OpenAI Codex、Claude Code和Gemini 2.5——发布了针对智能体的“系统卡片”,这是涵盖自主性级别、行为和真实世界风险分析的正式安全和评估文件。仅有五个智能体公布了已知的安全事件,而仅有两个智能体记录了提示注入漏洞。

该研究的首席研究员、剑桥大学莱弗休姆未来智能中心的Leon Staufer表示:“对AI安全至关重要的行为源于智能体本身的规划、工具、记忆和策略,而不仅仅是底层模型,但很少有开发者分享这些评估。”

浏览器代理:自主性最高,透明度最低

该研究识别出13个表现出“前沿水平”自主性的代理——即能够在最少人工监督下规划和执行多步骤任务的能力——但其中仅有4个披露了任何代理安全评估。浏览器代理能够代表用户浏览网站并执行操作,它们在自主性水平最高的同时,也存在最严重的安全信息缺失问题,有64%的安全相关字段未报告。企业代理紧随其后,缺失率为63%,而聊天代理的缺失率为43%。

研究结果还显示,30个代理中有21个没有记录默认行为来向网站或用户披露它们是AI而非人类。与此同时,人们对自主浏览代理如何与网络互动的担忧日益加剧;OpenAI本身在去年年底就承认,提示注入攻击——即网页上的隐藏指令可以劫持代理的行为——仍然是其防御的“最重大风险之一”,也是一项“长期的AI安全挑战”。

结构性不匹配

该指数中几乎所有智能体都依赖于仅仅三个模型家族——GPT、Claude或Gemini——这形成了研究人员所描述的整个生态系统的结构性依赖。“某一个模型的价格变化、服务中断或安全性退化可能会波及数百个AI智能体,”研究警告说。

Staufer表示:“最新的AI智能体指数揭示了部署速度与安全评估速度之间不断扩大的差距。大多数开发者很少分享有关安全性、评估和社会影响的信息。”

标签:AI 智能体安全透明度OpenAI剑桥大学

想了解 AI 如何助力您的企业?

免费获取企业 AI 成熟度诊断报告,发现转型机会

//

24小时热榜

阿联酋联手Colossal打造基因“诺亚方舟”
TOP1

阿联酋联手Colossal打造基因“诺亚方舟”

欧盟发布AI法案高风险系统关键指南
TOP2

欧盟发布AI法案高风险系统关键指南

3

马斯克 xAI 招聘加密货币专家,拓展 AI 金融能力

11小时前
马斯克 xAI 招聘加密货币专家,拓展 AI 金融能力
4

英伟达拟投200亿美元加码OpenAI

3小时前
英伟达拟投200亿美元加码OpenAI
5

研究警告:AI编程或侵蚀开源生态

47分钟前
研究警告:AI编程或侵蚀开源生态
6

特朗普政府改革和平队,用AI技术与中国竞争

21小时前
特朗普政府改革和平队,用AI技术与中国竞争
7

NASA警告:1.5万颗“城市杀手”小行星未被追踪,地球防御存巨大缺口

5小时前
NASA警告:1.5万颗“城市杀手”小行星未被追踪,地球防御存巨大缺口
8

NOAA 启用新厄尔尼诺指数,应对气候变暖挑战

6小时前
NOAA 启用新厄尔尼诺指数,应对气候变暖挑战
热门标签
大模型AgentRAG微调私有化部署Prompt EngineeringChatGPTClaudeDeepSeek智能客服知识管理内容生成代码辅助数据分析金融零售制造医疗教育AI 战略数字化转型ROI 分析OpenAIAnthropicGoogle

关注公众号

前途科技微信公众号

扫码关注,获取最新 AI 资讯

免费获取 AI 落地指南

3 步完成企业诊断,获取专属转型建议

已有 200+ 企业完成诊断

前途科技前途科技
服务关于快讯技术商业报告
前途科技微信公众号

微信公众号

扫码关注

Copyright © 2026 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。|京ICP备17045010号-1|京公网安备 11010502033860号