亚马逊AI编码助手闯祸，AWS服务中断13小时

技术2026年2月21日· 3 分钟阅读2 阅读

据《金融时报》报道，亚马逊AWS在12月因自家人工智能编码助手Kiro的误操作，导致一次长达13小时的服务中断。事件暴露了AI工具在关键云基础设施中的权限控制问题，引发内部对AI自主权限的质疑。亚马逊将事故归咎于用户操作失误，但已加强同行评审机制。

据英国《金融时报》周四报道，亚马逊网络服务（AWS）在12月遭遇至少两次与自家人工智能工具相关的服务中断，这引发了关于在关键云基础设施中授予AI系统自主权限的新质疑。

更值得关注的事件发生在12月中旬，当时AWS工程师允许Kiro——该公司的智能体AI编码助手——对一个面向客户的系统执行变更操作。然而，Kiro并未应用预期的修复方案，而是决定“删除并重建该环境”，引发了长达13小时的服务中断。英国《金融时报》援引四位知情人士的说法报道称，亚马逊发布了关于此次故障的内部事后分析报告，该故障影响了一个帮助客户分析服务成本的系统。

亚马逊云服务因AI工具导致中断

AWS 将事故归咎于用户操作失误，而非 AI

亚马逊反驳了将此次服务中断归咎于 AI 自主行为的说法。AWS 发言人向路透社表示，该事件是“用户操作失误——具体来说是访问控制配置错误——而非 AI”导致的。该公司称此次故障是一次“影响极其有限的事件”，仅影响其中国大陆两个区域之一的单一服务，并未影响计算、存储或数据库服务等核心产品。

亚马逊补充说，Kiro 默认情况下“在采取任何操作之前都会请求授权”，但承认参与 12 月事件的工程师拥有“超出预期的更广泛权限”。该公司将 AI 工具的参与描述为巧合，称人工操作也可能犯下类似的错误。

权限控制受到质疑

这起事件暴露了AWS内部对于AI编码工具应该拥有多大自由度的分歧。员工向英国《金融时报》透露，在12月的事故中，Kiro拥有与人类工程师相当的操作员级别权限，并且变更在没有第二人审批的情况下就上线了——绕过了通常对重大基础设施变更所要求的同行评审流程。此后，AWS已引入强制性同行评审机制，要求对生产环境访问进行审查，以防止类似事件再次发生。

12月还发生了另一起较小规模的中断事故，涉及另一款AI编码工具Amazon Q Developer，不过该次故障并未影响面向客户的服务。

12月的这些事件发生在2025年10月一次更大规模的AWS中断事故之后，那次故障造成了大范围的全球性中断，导致包括Reddit、Roblox和Snapchat在内的多个平台离线数小时。该次中断的源头追溯至AWS位于弗吉尼亚州北部的US-EAST-1区域，与AI工具无关。

这些披露正值亚马逊内部就强制要求工程师使用Kiro而非第三方AI编码工具的规定展开更广泛争论之际。约1,500名亚马逊工程师在内部论坛上支持了一篇帖子，呼吁获得使用Anthropic的Claude Code的权限，认为它在某些任务上的表现优于Kiro。亚马逊表示，约70%的软件工程师在1月份至少使用过一次Kiro。

亚马逊AI编码助手闯祸，AWS服务中断13小时