
OpenAI与《纽约时报》的2000万ChatGPT日志之争:隐私与版权的法庭对决
OpenAI近日向联邦法院提出申请,要求撤销一项命令,该命令强制其向《纽约时报》披露2000万条匿名化的ChatGPT聊天记录。OpenAI辩称,此举将侵犯用户隐私,并可能为未来的AI相关诉讼设定“危险先例”。这一举动发生在OpenAI面临周五的最后期限之前,该公司需在这一期限内,向《纽约时报》及其他媒体提起的版权侵权诉讼中提交这些聊天记录。
然而,OpenAI在其公开寻求支持的呼吁中并未强调,早在11月7日,地方法官奥娜·王(Ona Wang)就已对此案做出了不利于OpenAI的裁决,认为OpenAI提交日志“是适当的”。法官当时认定,现有的保护令以及OpenAI“详尽的去身份化”处理流程已足以保障用户隐私。
隐私主张与证据披露命令的冲突
OpenAI的首席信息安全官戴恩·斯塔基(Dane Stuckey)在周三发布的一篇博客文章中,指责《纽约时报》要求“侵犯用户隐私”,声称该报寻求的聊天记录来自“与《纽约时报》毫无根据的诉讼无关”的用户。OpenAI方面声称,所要求的聊天记录中有“99.99%”与版权主张无关。
这2000万条对话记录是从2022年12月至2024年11月期间的随机样本。OpenAI曾提出多种保护隐私的替代方案,包括仅针对包含《纽约时报》内容的聊天记录进行定向搜索,但这些提议均遭到了拒绝。
版权之战:核心在于训练数据
《纽约时报》于2023年12月起诉OpenAI和微软,指控这两家公司在未经许可或未支付报酬的情况下,使用“数百万”篇该报文章来训练ChatGPT,从而侵犯了其版权。《纽约时报》认为,获取这些日志对于分析ChatGPT如何复制其内容至关重要,同时也是为了反驳OpenAI关于其“入侵”聊天机器人以捏造证据的说法。
奥娜·王法官曾于2025年5月发布了一项保全令,要求OpenAI保留所有聊天记录,尽管该命令在9月被部分解除。目前围绕2000万条日志的披露争议,标志着这场证据披露战的进一步升级。
OpenAI坚称这一要求超出了合理的证据披露范围,并指出该公司“从未听说有任何法院曾下令如此大规模地批量生产个人信息”。此案是针对AI公司涉嫌滥用受版权保护材料进行训练的众多诉讼之一,潜在的赔偿金额可能高达数十亿美元。
