预印本平台 arXiv 开始对论文中明显由 AI 生成且未经核实的错误采取惩罚措施。违规作者将被封禁一年,解封后还需先通过同行评审才能重新提交。该禁令旨在应对 AI 生成内容泛滥的现状。
预印本平台 arXiv 近日决定,对提交包含明显 AI 生成错误的论文的研究人员实施处罚,违规作者将被封禁一年。禁令针对的是那些在论文中出现幻觉式引用、伪造结果或其他大语言模型未经验证输出的情况。
arXiv 机器学习类别版主 Thomas G. Dietterich 在社交平台 X 上发文说明了这一执行政策。他指出,根据 arXiv 的行为准则,每位列名作者都对论文内容承担“全部责任”,无论其内容是如何生成的。如果生成式 AI 工具产生了“不当语言、剽窃内容、偏见内容、错误、不正确的引用或误导性内容”,作者需承担后果。
具体处罚为封禁一年。解封后,违规作者提交新论文时还需满足额外条件:论文必须先在可靠的同行评审期刊或会议上被接收,arXiv 才会考虑发布。这相当于两阶段处罚,可能使研究者实际受影响的时长远超一年,因为缺乏预印本的铺垫,要获得同行评审发表本身就有难度。
数学家 Thomas Bloom 在 X 上澄清,arXiv“并非禁止使用 AI,也不是禁止那些用 AI 生成证明、代码等的论文”,政策只针对那些上传包含明显 AI 错误且未经核查的论文。
这项禁令的背景是 arXiv 正面临 AI 生成论文的激增。据《自然》杂志报道,自 2022 年底 ChatGPT 发布以来,arXiv 月投稿量增长了 50% 以上,而每月被拒论文数量则增加了五倍,超过 2400 篇。arXiv 联合创始人、康奈尔大学物理学家 Paul Ginsparg 告诉《自然》,AI 生成的垃圾论文“往往仅看摘要甚至快速浏览全文都无法辨别”,他称之为对系统的“存在性威胁”。
此前,arXiv 已于 2025 年 10 月开始采取措施,不再接收计算机科学领域的综述文章和立场性论文,除非它们已经过同行评审。理由是出现了“无法管理的涌入”的低质量 AI 生成稿件,这些文章“几乎只是带注释的参考文献列表”。
人工智能顶级会议上的分析显示,一些投稿论文完全由 AI 生成,其中含有大量伪造引用和幻觉内容。新的封禁政策表明,arXiv 打算追究个体作者的责任,而不是仅仅通过整体过滤某些类别的论文来应对。
免费获取企业 AI 成熟度诊断报告,发现转型机会
关注公众号

扫码关注,获取最新 AI 资讯
3 步完成企业诊断,获取专属转型建议
已有 200+ 企业完成诊断