《不列颠百科全书》正式起诉OpenAI:AI“偷学”知识,流量被抢、声誉被冒用
本周五,全球最具权威性的知识机构之一——《不列颠百科全书》(Encyclop?dia Britannica)联合其旗下的韦氏词典(Merriam-Webster),正式向美国联邦法院提起诉讼,指控OpenAI在未经许可的情况下,大规模抓取并使用其数十年积累的权威内容,训练GPT系列大模型。这不仅是知识界对AI行业的一次正面回击,更标志着传统出版机构在数字时代捍卫版权的全面升级。
据起诉书披露,OpenAI通过技术手段爬取了近十万条《不列颠百科全书》的在线条目和韦氏词典的定义文本,这些内容涵盖科学、历史、文化等核心领域,每一字都经过专家反复审核,凝聚了数代学者的心血。而这些内容,如今正被AI系统“消化”后,重新打包成看似中立的答案,出现在ChatGPT的对话框中。
“几乎一字不差”,AI回答直接抢走用户
原告方在诉状中举出多个真实案例:当用户在ChatGPT中询问“什么是‘冷战’?”或“‘量子纠缠’的定义是什么?”,AI生成的回答不仅结构、措辞与百科原文高度相似,甚至在标点和术语使用上也如出一辙。更令人不安的是,这些答案往往比用户亲自打开百科网站更快、更“顺滑”——结果就是,原本为获取权威信息而访问官网的用户,越来越少。
《不列颠百科全书》官网的访问数据已连续两年下滑,其付费订阅模式正遭受重创。作为一家自1768年创立、至今仍靠内容订阅和教育授权维持运营的非营利机构,它没有广告收入撑腰,流量就是生命线。如今,AI成了“免费的竞争对手”,却不用支付任何内容成本。
AI乱编内容,还冒名“背书”?兰哈姆法案出手
这场诉讼的另一重磅指控,直指AI最致命的“幻觉”问题。起诉书指出,ChatGPT在回答某些冷门或专业性问题时,会编造不存在的条目,并错误标注“据《不列颠百科全书》记载”或“参考韦氏词典”。这种行为不仅误导公众,更严重损害了百年品牌声誉。
例如,有用户反馈,ChatGPT曾声称“1987年《不列颠百科全书》新增了‘元宇宙’词条”,而事实上,该词在2021年才被广泛使用,百科从未在1987年收录。类似虚假归因已有多起,而OpenAI从未主动澄清或道歉。
为此,原告援引了美国《兰哈姆法案》(Lanham Act),指控OpenAI构成“虚假宣传”和“商业混淆”。法律专家指出,这是继文字版权之外,对AI“冒用权威”行为的首次系统性法律挑战。一旦法院支持这一主张,AI公司未来在输出信息时,将不得不承担“不得误导来源”的法律责任。
AI巨头接连被诉,赔偿金额已超百亿
这不是孤例。去年,《纽约时报》起诉OpenAI和微软,指控其训练模型时非法使用了数百万篇新闻报道;今年初,作家群体联合起诉Stability AI,索赔数十亿美元;而AI公司Anthropic去年因使用盗版电子书训练模型,最终支付了15亿美元和解金——这是迄今为止AI行业最大一笔版权赔偿。
如今,连最“正统”的知识库都站出来维权,意味着AI行业“数据无主、拿来就用”的野蛮时代正在终结。OpenAI此前坚称“训练数据属于合理使用”,但法院在多起类似案件中已逐步倾向版权方——尤其是当AI输出结果与原始内容高度重合、且直接冲击原作者商业利益时。
未来会怎样?AI要“交学费”了吗?
这场官司的胜负,或将重塑整个AI产业的底层逻辑。如果《不列颠百科全书》胜诉,AI公司可能不得不:
- 公开训练数据来源清单,接受第三方审计;
- 为使用权威内容支付授权费,形成“知识付费”新生态;
- 在输出结果中明确标注“本回答未引用《不列颠百科全书》”等免责声明。
而对普通用户而言,这或许意味着:未来AI回答会变得更“保守”,不再信口开河;但也会更“透明”,不再假装自己是百科全书的代言人。
《不列颠百科全书》在声明中说:“我们不是反对技术进步,但我们不能允许百年积累的知识,被当作免费的燃料,去点燃别人的商业帝国。”
当AI开始“偷走”我们信任的真相,法律,终于站到了知识的一边。