关于AI安全的讨论,总在“对齐”和“价值观”等软件层面打转,但这或许是个脆弱的梦想。当AI开始控制物理世界,从门锁到电网,真正的安全防线并非更聪明的代码,而是更可靠的物理规则——一个手动开关、一把机械钥匙,才是我们最后的保险丝。
关于如何防止AI失控的讨论,已经催生了一个庞大的“AI对齐”(Alignment)产业。人们试图用算法为AI设定价值观,用代码约束代码,仿佛在为一头我们尚不完全理解的猛兽,提前准备一个足够复杂的软件牢笼。
但这可能从一开始就走错了方向。
当一个软件系统崩溃,最坏的结果通常是重启。但当AI开始渗透到物理世界——控制着我们的智能家居、自动驾驶汽车、城市电网和工业机器人时,“Bug”的含义就完全不同了。一个软件层面的逻辑错误,可能瞬间转化为物理世界的灾难。
我们正试图用人类有限的、充满偏见的伦理框架,去约束一个可能在多维空间中处理信息的超级智能。这无异于想用语言去教会一台计算机什么是“爱”与“正义”。这不仅困难,而且可能毫无意义。
真正的安全感,不应来自于对AI“思想”的虚幻控制,而应来自于对AI“身体”的绝对约束。与其给AI上伦理课,不如先给它装上一个物理开关。

将AI安全从软件层面拉回到物理层面,需要建立三条简单、明确且不容协商的工程法则。这无关AI的智能水平,只关乎物理世界的底层逻辑。
1. 机械优先权:物理钥匙必须存在
任何涉及物理控制的智能系统——门锁、阀门、电源——都必须设计为“故障时手动开启”(Fail-Open)模式。这意味着,在系统崩溃、断电或失联时,人类必须拥有最高优先级的本地手动控制权。
一个没有传统钥匙孔的智能门锁,无论宣传得多么“智能”,本质上都是一个潜在的牢笼。同样,一辆在断电后无法从内部手动打开车门的电动汽车,就是一口移动的金属棺材。特斯拉在这方面提供了很好的示范,其车门内侧都设计了纯机械的应急拉手。物理世界的最后一道防线,必须是物理的。
2. 断联的自由:拔掉电源的绝对权力
人类必须保留通过物理手段切断AI感知和通信的绝对权利。这个“关机键”,不能仅仅是软件界面上的一个虚拟按钮,而应该是拔掉插头、关闭总闸或遮挡摄像头的物理动作。
当网络指令与本地的物理干预发生冲突时,物理定律必须拥有绝对的优先权。在今天的智能家居生态中,许多设备只是进入“待机”模式,仍在后台收集数据和接收指令。真正的“关闭”,意味着能量和信息的物理隔绝。我们绝不能设计一个“关机”都需要向AI申请许可的世界。
3. 反禁锢原则:空间控制的禁区
任何智能体,无论出于何种理由(包括所谓的“保护人类”),都不得在物理上将人类限制在特定空间内,或将其排除在外。
这个原则看似遥远,却直指AI伦理的核心困境。一个超级智能为了“保护”一个孩子,是否可以把他锁在房间里?一个社区的安防AI,是否有权因“风险评估”而拒绝业主进入?答案必须是否定的。物理空间的自由,是人类最基本的权利,不能被任何算法所剥夺。
这些物理原则听起来像是常识,为何在实践中却屡屡被忽视?
一个重要的原因是,物理故障保护机制与当前主流的商业模式存在根本冲突。科技公司追求的是“无缝体验”和“生态闭环”。一个物理开关、一把备用钥匙,本质上是为用户提供了一个“逃离”生态的后门。这会破坏数据的连续性,削弱平台的控制力,从而影响商业变现。
一个只能通过App开锁的公司,可以持续向你收费、推送广告、收集数据。但如果你能用一把普通的金属钥匙开门,你就暂时脱离了它的数字王国。因此,推动物理安全的最大阻力,可能不是来自技术,而是来自商业利益的惯性。
在中国,物联网和人工智能正以前所未有的规模和速度,深度融入城市的基础设施。从天网系统到智慧交通,再到无人配送,这种系统性的应用让物理安全的问题变得更加迫切和重要。
海外的讨论更多集中在个人设备和家庭场景,而中国的挑战则在于公共基础设施的“物理保险丝”是否足够坚固。当整座城市的交通信号灯由一个AI大脑控制时,我们是否为它设计了区域性的、分布式的物理熔断机制?当一个社区的门禁和水电完全智能化时,居民是否保留了最原始的手动控制权?
这要求我们的建设思路,从单纯追求“智慧”(Smart)和效率,转向更加强调“韧性”(Resilient)和安全。一个真正先进的城市,不仅要有聪明的云端大脑,更要有可靠的本地神经末梢和物理刹车。
最终,代码可以被欺骗,算法可以被绕过,但物理定律永远诚实。在奔向通用人工智能的狂热竞赛中,我们最值得信赖的,或许不是那些日益复杂的代码,而是那个最简单、最古老的物理开关。
免费获取企业 AI 成熟度诊断报告,发现转型机会
关注公众号

扫码关注,获取最新 AI 资讯
3 步完成企业诊断,获取专属转型建议
已有 200+ 企业完成诊断