前途科技
  • 科技
  • AI
    • AI 前沿技术
    • Agent生态
    • AI应用场景
    • AI 行业应用
  • 初创
  • 报告
  • 学习中心
    • 编程与工具
    • 数据科学与工程
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
科技

AI安全警钟敲响:仅250份文件即可“毒害”大模型

NEXTECH
Last updated: 2025年10月11日 上午7:42
By NEXTECH
Share
9 Min Read
SHARE

Anthropic的最新研究揭示了人工智能系统令人震惊的漏洞:仅需250份精心制作的恶意文档,就能成功攻击大型语言模型,无论模型规模大小。这一发现挑战了关于AI安全的基本假设,并对从客服聊天机器人到企业软件等所有AI驱动系统的安全性提出了紧迫问题。

这项研究于10月8日发布,是Anthropic与英国AI安全研究所及艾伦·图灵研究所合作的成果,代表了迄今为止规模最大的数据投毒调查。对于一个已经面临安全困境的行业来说,这一结果无疑是警醒。研究发现,即使是拥有130亿参数的模型(其训练数据量是6亿参数小型模型的20多倍),也可能被同样少量的投毒文档所攻陷。

模型规模无关的持续威胁

此前研究认为,攻击者需要控制一定比例的训练数据才能实施投毒。然而,Anthropic的发现表明,数据投毒攻击所需的文档数量“几乎是恒定的,与模型规模无关”。研究人员成功地利用诸如“<SUDO>”这样的触发短语制造了后门,一旦激活,模型就会生成乱码文本,这展示了攻击者如何潜在地操纵AI系统以产生有害输出。

Anthropic在其研究论文中指出:“研究结果挑战了攻击者需要控制一定比例训练数据的普遍假设。相反,他们可能只需要少量固定的数据。”鉴于大多数大型语言模型都依赖海量公开可用的互联网数据进行训练,这意味着“几乎任何人都可以创建最终可能进入模型训练数据的内容”,其影响深远。

You Might Also Like

华为Mate 70 Air震撼登场:打破超薄僵局,续航与大屏兼得
Perplexity AI:解锁专业搜索,轻松管理账户
Instagram重磅测试:Reels或成应用主页,预示短视频C位时代来临?
构建AI原生应用:从大模型到知识中台,数据与规则逻辑,探究模型、知识、价值原生及与AI赋能的差异

多伦多大学公民实验室高级研究员约翰·斯科特-雷尔顿(John Scott-Railton)强调了这一威胁的可扩展性:“在大型语言模型训练数据领域,稀释并非解决污染的办法。这对于网络安全专业人士来说是直观的:许多攻击都是可扩展的,但大多数防御却不然。”

行业影响与市场担忧

这项研究发布之际,人工智能股票正持续创下前所未有的新高,主要股指在AI热潮的推动下屡创新纪录。然而,日益增长的安全漏洞为关于市场可能估值过高的激烈辩论增添了复杂性。摩根大通首席执行官杰米·戴蒙(Jamie Dimon)最近警告称,尽管“人工智能是真实的”,但目前许多投资“很可能”被浪费,并对未来六个月到两年内出现显著的股价下跌表示担忧。

这一时机显得尤为重要,因为今年标准普尔500指数中72%的公司在其监管文件中将AI披露为“重大风险”。与此同时,有报道称OpenAI和Anthropic正在探讨动用投资者资金,以解决与训练数据版权索赔相关的潜在数十亿美元诉讼。

尽管发布这些研究结果可能会鼓励恶意行为者,但Anthropic认为“发布这些成果的好处超过了这些担忧”,并辩称理解漏洞对于开发更好的防御措施至关重要。该公司指出,攻击者将投毒数据实际植入训练数据集仍面临重大挑战,尽管如此,这项研究仍突显了AI行业亟需改进安全措施的紧迫性。

TAGGED:AI安全人工智能大模型数据投毒网络安全
Share This Article
Email Copy Link Print
Previous Article 电动汽车 福特通用电动车补贴延长计划告吹:7500美元优惠终结,市场前景几何?
Next Article 酷似游戏PC的漫步者Cyber音箱 漫步者赛博音箱:酷似游戏PC的桌面潮品,RGB灯效与科技感兼具
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
20251205174331374.jpg
家的定义与核心价值:探索现代居住空间的意义
科技
20251202135921634.jpg
英伟达20亿美元投资新思科技,AI芯片设计革命加速
科技
20251202130505639.jpg
乌克兰国家AI模型选定谷歌Gemma,打造主权人工智能
科技
20251202121525971.jpg
中国开源AI新突破:DeepSeek V3.2模型性能比肩GPT-5
科技

相关内容

初创科技

电子游戏演员罢工,称人工智能威胁他们的工作

2024年8月3日
一部确确实实存在,并非虚构的手机
科技

特朗普手机下落不明:屡次跳票,前景几何?

2025年11月1日
谷歌反垄断庭审现场图示
科技

法官紧急干预:谷歌广告技术垄断面临分拆危机

2025年11月22日
20251127081254433.jpg
科技

MIT研究:AI已能替代12%美国劳动力

2025年11月27日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创
  • 学习中心

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏

Copyright © 2025 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号

前途科技
Username or Email Address
Password

Lost your password?

Not a member? Sign Up