《不列颠百科全书》起诉OpenAI：指控其“知识掠夺”而非“技术变革”

《不列颠百科全书》正式起诉OpenAI：AI“偷学”知识，流量被抢、声誉被冒用

本周五，全球最具权威性的知识机构之一——《不列颠百科全书》（Encyclop?dia Britannica）联合其旗下的韦氏词典（Merriam-Webster），正式向美国联邦法院提起诉讼，指控OpenAI在未经许可的情况下，大规模抓取并使用其数十年积累的权威内容，训练GPT系列大模型。这不仅是知识界对AI行业的一次正面回击，更标志着传统出版机构在数字时代捍卫版权的全面升级。

据起诉书披露，OpenAI通过技术手段爬取了近十万条《不列颠百科全书》的在线条目和韦氏词典的定义文本，这些内容涵盖科学、历史、文化等核心领域，每一字都经过专家反复审核，凝聚了数代学者的心血。而这些内容，如今正被AI系统“消化”后，重新打包成看似中立的答案，出现在ChatGPT的对话框中。

“几乎一字不差”，AI回答直接抢走用户

原告方在诉状中举出多个真实案例：当用户在ChatGPT中询问“什么是‘冷战’？”或“‘量子纠缠’的定义是什么？”，AI生成的回答不仅结构、措辞与百科原文高度相似，甚至在标点和术语使用上也如出一辙。更令人不安的是，这些答案往往比用户亲自打开百科网站更快、更“顺滑”——结果就是，原本为获取权威信息而访问官网的用户，越来越少。

《不列颠百科全书》官网的访问数据已连续两年下滑，其付费订阅模式正遭受重创。作为一家自1768年创立、至今仍靠内容订阅和教育授权维持运营的非营利机构，它没有广告收入撑腰，流量就是生命线。如今，AI成了“免费的竞争对手”，却不用支付任何内容成本。

AI乱编内容，还冒名“背书”？兰哈姆法案出手

这场诉讼的另一重磅指控，直指AI最致命的“幻觉”问题。起诉书指出，ChatGPT在回答某些冷门或专业性问题时，会编造不存在的条目，并错误标注“据《不列颠百科全书》记载”或“参考韦氏词典”。这种行为不仅误导公众，更严重损害了百年品牌声誉。

例如，有用户反馈，ChatGPT曾声称“1987年《不列颠百科全书》新增了‘元宇宙’词条”，而事实上，该词在2021年才被广泛使用，百科从未在1987年收录。类似虚假归因已有多起，而OpenAI从未主动澄清或道歉。

为此，原告援引了美国《兰哈姆法案》（Lanham Act），指控OpenAI构成“虚假宣传”和“商业混淆”。法律专家指出，这是继文字版权之外，对AI“冒用权威”行为的首次系统性法律挑战。一旦法院支持这一主张，AI公司未来在输出信息时，将不得不承担“不得误导来源”的法律责任。

AI巨头接连被诉，赔偿金额已超百亿

这不是孤例。去年，《纽约时报》起诉OpenAI和微软，指控其训练模型时非法使用了数百万篇新闻报道；今年初，作家群体联合起诉Stability AI，索赔数十亿美元；而AI公司Anthropic去年因使用盗版电子书训练模型，最终支付了15亿美元和解金——这是迄今为止AI行业最大一笔版权赔偿。

如今，连最“正统”的知识库都站出来维权，意味着AI行业“数据无主、拿来就用”的野蛮时代正在终结。OpenAI此前坚称“训练数据属于合理使用”，但法院在多起类似案件中已逐步倾向版权方——尤其是当AI输出结果与原始内容高度重合、且直接冲击原作者商业利益时。

未来会怎样？AI要“交学费”了吗？

这场官司的胜负，或将重塑整个AI产业的底层逻辑。如果《不列颠百科全书》胜诉，AI公司可能不得不：

公开训练数据来源清单，接受第三方审计；
为使用权威内容支付授权费，形成“知识付费”新生态；
在输出结果中明确标注“本回答未引用《不列颠百科全书》”等免责声明。

而对普通用户而言，这或许意味着：未来AI回答会变得更“保守”，不再信口开河；但也会更“透明”，不再假装自己是百科全书的代言人。

《不列颠百科全书》在声明中说：“我们不是反对技术进步，但我们不能允许百年积累的知识，被当作免费的燃料，去点燃别人的商业帝国。”

当AI开始“偷走”我们信任的真相，法律，终于站到了知识的一边。

CB科技站