arXiv 对 AI 论文错误实施一年禁令

预印本平台 arXiv 近日决定，对提交包含明显 AI 生成错误的论文的研究人员实施处罚，违规作者将被封禁一年。禁令针对的是那些在论文中出现幻觉式引用、伪造结果或其他大语言模型未经验证输出的情况。

arXiv 机器学习类别版主 Thomas G. Dietterich 在社交平台 X 上发文说明了这一执行政策。他指出，根据 arXiv 的行为准则，每位列名作者都对论文内容承担“全部责任”，无论其内容是如何生成的。如果生成式 AI 工具产生了“不当语言、剽窃内容、偏见内容、错误、不正确的引用或误导性内容”，作者需承担后果。

具体处罚为封禁一年。解封后，违规作者提交新论文时还需满足额外条件：论文必须先在可靠的同行评审期刊或会议上被接收，arXiv 才会考虑发布。这相当于两阶段处罚，可能使研究者实际受影响的时长远超一年，因为缺乏预印本的铺垫，要获得同行评审发表本身就有难度。

数学家 Thomas Bloom 在 X 上澄清，arXiv“并非禁止使用 AI，也不是禁止那些用 AI 生成证明、代码等的论文”，政策只针对那些上传包含明显 AI 错误且未经核查的论文。

这项禁令的背景是 arXiv 正面临 AI 生成论文的激增。据《自然》杂志报道，自 2022 年底 ChatGPT 发布以来，arXiv 月投稿量增长了 50% 以上，而每月被拒论文数量则增加了五倍，超过 2400 篇。arXiv 联合创始人、康奈尔大学物理学家 Paul Ginsparg 告诉《自然》，AI 生成的垃圾论文“往往仅看摘要甚至快速浏览全文都无法辨别”，他称之为对系统的“存在性威胁”。

此前，arXiv 已于 2025 年 10 月开始采取措施，不再接收计算机科学领域的综述文章和立场性论文，除非它们已经过同行评审。理由是出现了“无法管理的涌入”的低质量 AI 生成稿件，这些文章“几乎只是带注释的参考文献列表”。

人工智能顶级会议上的分析显示，一些投稿论文完全由 AI 生成，其中含有大量伪造引用和幻觉内容。新的封禁政策表明，arXiv 打算追究个体作者的责任，而不是仅仅通过整体过滤某些类别的论文来应对。