“`html

AI主权时代:美国影响力衰退下的技术自主之路
台湾RightsCon数字权利大会上,一股隐忧悄然蔓延:美国政府对全球数字权利工作的资助骤减,令众多民间组织措手不及。这并非孤立事件,它预示着全球科技格局的深刻变革。
特朗普政府时期政策的急转直下,不仅削弱了美国政府的影响力,也波及美国科技巨头。这些公司在非英语地区,特别是用户规模较小的社群的投入明显减少。RightsCon与会者对此深感担忧。
欧洲等地区正因此重新评估对美国科技的依赖,积极探索本土替代方案,人工智能领域尤为突出。巴西法学教授Yasmin Curzi一针见血地指出:“自特朗普第二任期以来,我们已无法再依赖美国社交媒体平台履行最基本的责任。”
社交媒体的内容审核系统,即使已采用自动化和大型语言模型(LLM),在检测印度、南非和巴西等地的性别暴力方面依然力不从心。人权律师Marlena Wisniak警告,过度依赖LLM反而会加剧问题:“LLM本身审核不力,又用来审核其他内容,错误循环放大,后果不堪设想。”
症结在于,这些系统主要基于英语数据训练,对非西方语言和语境理解不足。即使是多语言模型,在处理非西方语言时表现也差强人意。ChatGPT医疗咨询的评估结果显示,中文和印地语的准确性远低于英语和西班牙语。
RightsCon大会上,许多人呼吁发展更贴近社群需求的AI方案,包括针对特定语言和文化语境的小型语言模型、聊天机器人和数据集。这些系统能够识别俚语和辱骂性词汇,理解多种语言和文字混合的表达,甚至辨别“被回收的语言”(曾经的辱骂语,现被目标群体重新赋予意义)。这些都是现有以英语为中心的模型难以胜任的。
事实上,类似的解决方案已研发多年,例如Mozilla主导的志愿者项目,以及Lelapa AI等初创公司。小型语言模型今年甚至被列入我们2025年十大突破性技术名单。然而,如今的形势却有所不同。
首先,最新的研究表明,数据集大小不再是语言模型性能的决定性因素,这意味着更多人能够参与创建。民主与科技中心访问学者Aliya Bhatia指出,“小型语言模型在特定低资源语言中,可能足以与多语言模型竞争。”
其次,全球科技竞争日益白热化。巴黎人工智能峰会之后,“AI主权”倡议层出不穷,各国力求掌控AI发展的各个环节。这与更广泛的“技术主权”运动相呼应,旨在解决数据传输至美国的隐私和安全问题。欧盟已任命首位技术主权、安全与民主事务专员,并积极推进“欧罗巴科技栈”计划,这将涵盖现代社会和未来创新所需的一切资源,而这些目前主要由美国科技公司提供。
Proton首席执行官Andy Yen认为,特朗普政府的政策“促使欧洲加快步伐……认识到欧洲需要重获技术主权”。这不仅因为总统对科技CEO的影响力,更因为“科技是任何国家未来经济增长的关键”。
然而,政府介入并不意味着语言模型的包容性问题会自动消失。Bhatia提醒道:“政府的角色需要有界限。如果政府决定‘我们要发展哪些语言’或‘数据集要反映哪些观点’,那就很棘手了。模型的训练数据决定了它的世界观。”
未来走向尚不明朗,但这场变革值得我们持续关注。
本文最初发表于我们的AI周刊《算法》。订阅获取更多精彩内容。
“`
