多家出版商起诉Meta：AI训练涉嫌侵权

出版商集体起诉Meta：AI训练背后，是谁在“偷书”？

近日，一场震动出版界与科技圈的法律战在纽约曼哈顿联邦法院拉开帷幕。包括爱思唯尔、圣智、阿歇特、麦克米伦和麦格劳-希尔在内的五家全球顶尖出版商，联合将Meta Platforms告上法庭，指控其未经许可，大规模抓取并使用数百万册受版权保护的图书和学术期刊，用于训练其开源AI模型Llama。

这些被“拿来训练”的作品，远不止冷冰冰的论文。它们包括《第五季》《荒野机器人》等畅销小说，也涵盖医学、工程、经济学等领域的权威教科书——这些书正是全球高校和研究机构的标配教材。出版商称，Meta的爬虫系统在公开网络上广泛抓取内容，甚至绕过网站的robots.txt协议，将大量受版权保护的文本直接喂给AI模型，而从未支付任何费用，也未获得授权。

“这不是技术实验，这是系统性盗版。”美国出版商协会主席玛丽亚·帕兰特在公开声明中直言，“如果科技公司可以随便拿走作家、学者几十年的心血来喂AI，那谁还愿意写书？谁还愿意做研究？”

Meta的回应则显得轻描淡写。公司发言人称：“AI正在重塑创新的边界，而合理使用原则早已为这类技术发展留出了空间。”他们援引此前美国法院在“谷歌图书扫描案”中的判决，试图证明“训练AI属于合理使用”。但出版商们立刻反驳：谷歌扫描的是图书目录和片段，用于搜索检索；而Meta是直接复制整本内容，用于生成新文本——这根本不是“搜索”，而是“复制+再生产”。

更值得关注的是，这场诉讼并非孤例。就在同一时期，纽约时报、美联社、作家协会等也分别对OpenAI、Anthropic等AI公司提起类似诉讼。版权问题正从“边缘争议”演变为行业生死线。有行业分析师指出，若Meta败诉，未来所有AI公司都可能面临“训练数据合法性”的重新审查——这意味着，从GitHub代码到学术论文，从小说到新闻报道，AI训练的“数据饲料”或将面临全面清理。

而对普通用户来说，这场官司的影响可能比想象中更近。如果AI模型因版权风险被迫“断粮”，你未来用的智能助手、写作工具、甚至翻译软件，都可能变得“知识贫瘠”——它们将只能依赖公开、低质或过期的内容，失去深度与准确性。

这场官司，不只是Meta和出版商之间的拉锯，更是整个数字时代对“知识所有权”的重新定义。当AI能写出一本像样的小说，谁该拥有它的灵魂？是写出原作的作者？是训练它的公司？还是用它生成内容的你？

办公桌起诉法律 (2)

为什么这场官司，每个读者都该关心？

你可能觉得：“我只是用AI写个周报，关我什么事？”但事实是，你每天使用的AI工具，背后都依赖着海量文本数据。这些数据从哪来？如果今天Meta能免费用《哈利·波特》训练模型，明天它就能生成一本“新版哈利·波特”，并卖给你的孩子——而原著作者J.K.罗琳分文未得。

更现实的是，学术界正面临“AI造假”危机。已有教授发现，学生提交的论文中出现了大量AI生成的“伪引用”——这些引用看似真实，实则来自被AI误读或捏造的期刊文章。出版商警告：若AI训练数据缺乏合法来源，整个学术诚信体系都将动摇。

与此同时，独立作家和小出版社正陷入困境。他们没有资源去监控网络盗用，也无法像大出版商一样发起诉讼。如果Meta赢了，等于宣告：只要你是“科技巨头”，就可以合法“吃掉”中小创作者的劳动成果。

目前，此案尚未进入庭审阶段，但已引发美国国会关注。多位议员正在起草《AI训练数据透明法案》，要求AI公司公开训练数据来源，并建立版权补偿机制。这场官司的走向，或将决定未来十年AI产业的规则——是继续野蛮生长，还是回归尊重与契约？

答案，不在硅谷的会议室里，而在每一个曾为一本书、一篇文章、一个想法付出心血的人手中。

CB科技站

多家出版商起诉Meta：AI训练涉嫌侵权

出版商集体起诉Meta：AI训练背后，是谁在“偷书”？

为什么这场官司，每个读者都该关心？

与本文相关的文章