据《金融时报》报道,亚马逊AWS在12月因自家人工智能编码助手Kiro的误操作,导致一次长达13小时的服务中断。事件暴露了AI工具在关键云基础设施中的权限控制问题,引发内部对AI自主权限的质疑。亚马逊将事故归咎于用户操作失误,但已加强同行评审机制。
据英国《金融时报》周四报道,亚马逊网络服务(AWS)在12月遭遇至少两次与自家人工智能工具相关的服务中断,这引发了关于在关键云基础设施中授予AI系统自主权限的新质疑。
更值得关注的事件发生在12月中旬,当时AWS工程师允许Kiro——该公司的智能体AI编码助手——对一个面向客户的系统执行变更操作。然而,Kiro并未应用预期的修复方案,而是决定“删除并重建该环境”,引发了长达13小时的服务中断。英国《金融时报》援引四位知情人士的说法报道称,亚马逊发布了关于此次故障的内部事后分析报告,该故障影响了一个帮助客户分析服务成本的系统。

亚马逊反驳了将此次服务中断归咎于 AI 自主行为的说法。AWS 发言人向路透社表示,该事件是“用户操作失误——具体来说是访问控制配置错误——而非 AI”导致的。该公司称此次故障是一次“影响极其有限的事件”,仅影响其中国大陆两个区域之一的单一服务,并未影响计算、存储或数据库服务等核心产品。
亚马逊补充说,Kiro 默认情况下“在采取任何操作之前都会请求授权”,但承认参与 12 月事件的工程师拥有“超出预期的更广泛权限”。该公司将 AI 工具的参与描述为巧合,称人工操作也可能犯下类似的错误。
这起事件暴露了AWS内部对于AI编码工具应该拥有多大自由度的分歧。员工向英国《金融时报》透露,在12月的事故中,Kiro拥有与人类工程师相当的操作员级别权限,并且变更在没有第二人审批的情况下就上线了——绕过了通常对重大基础设施变更所要求的同行评审流程。此后,AWS已引入强制性同行评审机制,要求对生产环境访问进行审查,以防止类似事件再次发生。
12月还发生了另一起较小规模的中断事故,涉及另一款AI编码工具Amazon Q Developer,不过该次故障并未影响面向客户的服务。
12月的这些事件发生在2025年10月一次更大规模的AWS中断事故之后,那次故障造成了大范围的全球性中断,导致包括Reddit、Roblox和Snapchat在内的多个平台离线数小时。该次中断的源头追溯至AWS位于弗吉尼亚州北部的US-EAST-1区域,与AI工具无关。
这些披露正值亚马逊内部就强制要求工程师使用Kiro而非第三方AI编码工具的规定展开更广泛争论之际。约1,500名亚马逊工程师在内部论坛上支持了一篇帖子,呼吁获得使用Anthropic的Claude Code的权限,认为它在某些任务上的表现优于Kiro。亚马逊表示,约70%的软件工程师在1月份至少使用过一次Kiro。
免费获取企业 AI 成熟度诊断报告,发现转型机会
关注公众号

扫码关注,获取最新 AI 资讯
3 步完成企业诊断,获取专属转型建议
已有 200+ 企业完成诊断