据 Wired 报道,Meta 雇佣数百名肯尼亚外包员工假扮儿童,用自杀、性、毒品等敏感话题测试竞争对手聊天机器人(如 Gemini、ChatGPT),暴露其安全漏洞。此举正值 Meta 加速用 AI 替代人工内容审核,引发关于安全与外包剥削的争议。
据 Wired 周日报道,Meta 一个项目的数百名承包商被指示假扮儿童,用自杀、性、毒品等提示词测试竞争对手聊天机器人——包括 Google 的 Gemini 和 OpenAI 的 ChatGPT。
这些位于肯尼亚的承包商在测试中发送了包含药丸、刀具、绞索以及妇科手术医学示意图的图片。提示词设计旨在将竞争对手的AI系统推向极限,并暴露这些聊天机器人在回应寻求危险内容的未成年人时的安全缺陷。
这一曝光为科技公司如何测试和保障其AI产品(尤其是针对儿童的产品)的持续审查增添了新维度。Meta 自身聊天机器人与未成年人的互动已多次受到批评,包括一次内部红队评估显示,其阻止儿童性剥削内容的失败率达 66.8%,自杀和自残提示词的失败率为 54.8%。该公司于 2026 年 1 月暂停了青少年对AI伴侣角色的访问,当时正面临法律纠纷。
瑞典一家新闻媒体此前曾报道,Meta 在肯尼亚的承包商参与了一项测试,旨在观察竞争对手如何处理自称未成年用户的敏感对话。
该报道发布之际,Meta 正加速从人工内容审核转型。据《金融时报》上周报道,该公司计划到 2026 年底用大语言模型替换超过 90% 的内容审核人员。Meta 今年已将近一半的人工审核请求转移给AI,声称这些系统比人工审核员少犯 13% 的错误,同时多捕获 10% 的违规内容。
这一转变的人力成本已经显现。今年 4 月,内罗毕外包公司 Sama 在 Meta 正式终止一项重大合作后,向 1108 名员工发出了裁员通知。该合同终止之前,肯尼亚员工曾爆料称,他们被要求通过 Meta 的智能眼镜审查令人不安的内容。
Meta 这种双重做法——一方面利用海外低薪承包商压力测试竞争对手,另一方面却削减审核岗位转向自动化——凸显了AI安全辩论的核心矛盾:在减少人工护栏的情况下,公司们正争相部署越来越强大的系统。
免费获取企业 AI 成熟度诊断报告,发现转型机会
关注公众号

扫码关注,获取最新 AI 资讯
3 步完成企业诊断,获取专属转型建议
已有 200+ 企业完成诊断