arXiv重磅新规:严打AI代写,作者须为每句话负责
近日,全球科研界最受信赖的预印本平台arXiv宣布推出史上最严格的内容规范,直指近年来愈演愈烈的“AI代写”乱象。新规明确:凡论文中出现AI生成的虚假数据、错误引用、逻辑漏洞或“幻觉”内容,作者将面临最高一年的发布禁令。这不是限制技术,而是重申学术诚信的底线。

从康奈尔托管到独立运营:为质量护航
自1991年诞生以来,arXiv一直由康奈尔大学托管,免费向全球学者开放。但随着AI生成内容激增,平台每年收到的低质投稿呈指数级增长——仅2023年,计算机科学与数学领域就有超15%的论文被人工审核标记为“疑似AI生成”。为提升审查能力,arXiv已于2024年完成组织转型,正式脱离高校体系,成为独立非营利机构。
新架构下,平台已获得来自西蒙斯基金会、斯隆基金会等顶级科研资助方的数百万美元专项支持,用于组建专业审核团队、部署AI检测工具,并建立“作者信用档案”系统。未来,每篇投稿都将经过“机器初筛+人工复核”双层过滤,确保学术传播的严肃性。
违规者禁发一年,复出需期刊背书
新规的核心处罚机制清晰而严厉:
- 一经查实论文中存在AI生成的错误事实、虚构参考文献或刻意植入提示词以“优化”文本,作者将被暂停发布权限长达12个月;
- 禁令期满后,若想重新投稿,必须提供已被SCI/SSCI收录期刊正式接受的证明——这意味着,作者必须通过传统同行评审的严格把关,才能重返arXiv;
- 多次违规者将被列入“黑名单”,永久失去投稿资格。
这一设计并非“惩罚主义”,而是倒逼学者回归科研本质:AI可以帮你润色语法、整理文献,但绝不能替你思考、替你造假。
不禁止AI,但必须“署名责任”
arXiv官方在公告中特别澄清:“我们从不反对使用AI工具。很多研究者用它翻译论文、生成图表代码、辅助数据分析——这完全没问题。”
真正被禁止的,是“把AI当枪手”:复制粘贴AI生成的段落而不加核实、用AI编造实验数据、让AI伪造参考文献、甚至用AI模仿他人写作风格以逃避查重。
新规要求作者在投稿时签署《内容责任声明》,明确承诺:“我已逐字审阅并确认本文所有陈述、数据、引文均为本人真实工作成果,AI仅作为辅助工具使用。”
真实案例:AI“幻觉”如何毁掉一篇论文
2023年底,一篇发表于arXiv的量子计算论文被撤回,原因令人震惊:作者用AI生成了“新型量子纠错码”,但AI虚构了三篇根本不存在的参考文献,其中一篇还“引用”了已故物理学家1978年的论文——而该论文实际从未讨论过相关内容。
该论文被引用27次后,一名博士生在复现实验时发现无法复现结果,最终通过交叉比对发现骗局。arXiv团队随后追踪到作者过去半年内提交的5篇论文均存在类似问题,最终予以封禁。
这类事件并非孤例。据《自然》杂志2024年4月报道,全球已有至少7所高校启动AI论文专项调查,arXiv的举措,正是对整个学术生态的警醒。
作者可申诉,但证据必须过硬
新规也保留了正当程序:被指控的作者有权在14天内提交证据申诉,包括原始实验记录、代码版本、草稿修改历史等。arXiv审核团队由资深科学家与技术专家组成,拒绝仅凭AI检测工具下结论。
“我们不信任算法,我们相信人。”arXiv执行主任在内部备忘录中写道,“如果你用AI写论文,那它就是你的论文。你必须能为每一个字负责。”
对科研人员而言,这不仅是规则的更新,更是一次价值重申:真正的创新,从不需要AI替你思考。