前途科技
  • 科技
  • AI
    • AI 前沿技术
    • Agent生态
    • AI应用场景
    • AI 行业应用
  • 初创
  • 报告
  • 学习中心
    • 编程与工具
    • 数据科学与工程
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
科技

AI安全警钟敲响:仅250份文件即可“毒害”大模型

NEXTECH
Last updated: 2025年10月11日 上午7:42
By NEXTECH
Share
9 Min Read
SHARE

Anthropic的最新研究揭示了人工智能系统令人震惊的漏洞:仅需250份精心制作的恶意文档,就能成功攻击大型语言模型,无论模型规模大小。这一发现挑战了关于AI安全的基本假设,并对从客服聊天机器人到企业软件等所有AI驱动系统的安全性提出了紧迫问题。

这项研究于10月8日发布,是Anthropic与英国AI安全研究所及艾伦·图灵研究所合作的成果,代表了迄今为止规模最大的数据投毒调查。对于一个已经面临安全困境的行业来说,这一结果无疑是警醒。研究发现,即使是拥有130亿参数的模型(其训练数据量是6亿参数小型模型的20多倍),也可能被同样少量的投毒文档所攻陷。

模型规模无关的持续威胁

此前研究认为,攻击者需要控制一定比例的训练数据才能实施投毒。然而,Anthropic的发现表明,数据投毒攻击所需的文档数量“几乎是恒定的,与模型规模无关”。研究人员成功地利用诸如“<SUDO>”这样的触发短语制造了后门,一旦激活,模型就会生成乱码文本,这展示了攻击者如何潜在地操纵AI系统以产生有害输出。

Anthropic在其研究论文中指出:“研究结果挑战了攻击者需要控制一定比例训练数据的普遍假设。相反,他们可能只需要少量固定的数据。”鉴于大多数大型语言模型都依赖海量公开可用的互联网数据进行训练,这意味着“几乎任何人都可以创建最终可能进入模型训练数据的内容”,其影响深远。

You Might Also Like

苹果手表侵权Masimo血氧专利,被判赔6.34亿美元!ITC重启调查
曝苹果正用“Veritas”测试Siri AI升级:仅限员工使用
LG 32英寸 6K 雷电5 显示器重磅来袭:预售开启,定价1999美元
Meta欲打造机器人界‘安卓’:AI软件平台引领人形机器人新时代

多伦多大学公民实验室高级研究员约翰·斯科特-雷尔顿(John Scott-Railton)强调了这一威胁的可扩展性:“在大型语言模型训练数据领域,稀释并非解决污染的办法。这对于网络安全专业人士来说是直观的:许多攻击都是可扩展的,但大多数防御却不然。”

行业影响与市场担忧

这项研究发布之际,人工智能股票正持续创下前所未有的新高,主要股指在AI热潮的推动下屡创新纪录。然而,日益增长的安全漏洞为关于市场可能估值过高的激烈辩论增添了复杂性。摩根大通首席执行官杰米·戴蒙(Jamie Dimon)最近警告称,尽管“人工智能是真实的”,但目前许多投资“很可能”被浪费,并对未来六个月到两年内出现显著的股价下跌表示担忧。

这一时机显得尤为重要,因为今年标准普尔500指数中72%的公司在其监管文件中将AI披露为“重大风险”。与此同时,有报道称OpenAI和Anthropic正在探讨动用投资者资金,以解决与训练数据版权索赔相关的潜在数十亿美元诉讼。

尽管发布这些研究结果可能会鼓励恶意行为者,但Anthropic认为“发布这些成果的好处超过了这些担忧”,并辩称理解漏洞对于开发更好的防御措施至关重要。该公司指出,攻击者将投毒数据实际植入训练数据集仍面临重大挑战,尽管如此,这项研究仍突显了AI行业亟需改进安全措施的紧迫性。

TAGGED:AI安全人工智能大模型数据投毒网络安全
Share This Article
Email Copy Link Print
Previous Article 电动汽车 福特通用电动车补贴延长计划告吹:7500美元优惠终结,市场前景几何?
Next Article 酷似游戏PC的漫步者Cyber音箱 漫步者赛博音箱:酷似游戏PC的桌面潮品,RGB灯效与科技感兼具
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
拥抱AI的“人性化”愿景:工具而非替代品
AI
图1:决策树分类器在Excel中的示例
机器学习决策树分类器全解析:从基尼系数到Excel实战
未分类
X平台标志与欧盟旗帜
欧盟重罚X平台1.2亿欧元,马斯克强硬反击:关闭其广告账户
科技
《战略数据科学家:在AI时代进阶与成长》书籍封面
破解数据科学晋升密码:从L3到L6,你需要的是思维跃迁,而非技术堆叠
职业发展与学习路径

相关内容

20251117191930544.jpg
科技

帕金森治疗新突破:BrainXell iPSC细胞疗法前景可期

2025年11月17日
初创科技

INE 安全警报:忽视网络安全培训的代价高昂

2024年8月21日
20250926065443943.jpg
科技

Meta青少年安全工具被指“形同虚设”:新报告揭露64%失效

2025年9月26日
20251007095609952.jpg
科技

重磅!Salesforce被曝10亿记录遭窃,勒索危机升级

2025年10月7日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创
  • 学习中心

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏

Copyright © 2025 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号

前途科技
Username or Email Address
Password

Lost your password?

Not a member? Sign Up