
Reddit起诉Perplexity AI及三家数据抓取公司
Reddit刚在2025年6月起诉Anthropic未经授权使用其平台内容训练AI模型,本周又转向起诉Perplexity AI,以及另外三家数据采集公司SerpApi、Oxylabs UAB与AWMProxy,指控它们大规模以不正当方式爬取Reddit上的内容。而此次Perplexity AI也迅速通过Reddit平台作出回应。
Reddit声称,Perplexity AI,以及美国的SerpApi、立陶宛的Oxylabs UAB和俄罗斯的AWMProxy等数据采集公司,以工业规模且非法的方式从Reddit抓取用户发帖与评论,并将其用于商业用途,特别是用于训练或支持AI搜索/问答系统。其中,SerpApi、Oxylabs UAB及AWMProxy伪装身份、隐藏IP地址,假冒真实用户绕过Reddit的技术防护措施,甚至通过Google搜索结果页面间接抓取Reddit数据。
此外,Reddit还指控Perplexity AI至少是上述某一家公司的客户,购买其采集的数据来构建自身的答案引擎。Reddit已向法院申请禁令,要求禁止被告方使用或出售自Reddit抓取的数据,终止相关行为,并索赔经济损失。
截至目前,Reddit已与OpenAI、Google及Sprinklr等AI企业达成内容授权合作协议,但Perplexity AI始终未与其签署正式授权协议。
然而,就在同一天,Perplexity AI通过Reddit平台反击,指出当公开数据成为上市公司商业模式的重要组成部分时,就注定会出现今天的局面。出售训练数据使用权正逐渐成为Reddit重要的收入来源,外界猜测此次诉讼意在向Google和OpenAI等公司在内容授权谈判中展示强硬姿态。
Perplexity AI澄清,公司并非无视Reddit提出的授权问题,而是曾向对方解释:Perplexity AI属于应用层公司,不会利用任何内容来训练模型,也从未进行过此类操作,因此无法也不应签署内容授权协议。即便如此,Reddit仍坚持要求其付费使用。
Perplexity AI的答案搜索引擎主要功能是搜索网络信息、识别可靠来源,并将资讯整合为清晰、最新的回答,集中呈现用户所需的关键见解。该公司表示,其使用Reddit内容的方式是对讨论内容进行摘要,并在答案中引用相关讨论帖链接。然而,Reddit近期改变了政策,不再允许Perplexity用户在检索过程中访问其公开内容。尽管Reddit认为这是其正当权利,但这一做法被认为违背了开放网络的精神。
不过,目前Reddit超过九成的收入仍来自广告。根据该公司2025年第二季度财报,该季度总收入达5亿美元,同比增长78%,其中广告收入为4.65亿美元,而包括授权在内的其他收入仅为3500万美元。该季度Reddit每股收益为0.48美元。