Reddit起诉Perplexity AI及3家数据爬取公司

Reddit起诉Perplexity AI及三家数据抓取公司

Reddit刚在2025年6月起诉Anthropic未经授权使用其平台内容训练AI模型，本周又转向起诉Perplexity AI，以及另外三家数据采集公司SerpApi、Oxylabs UAB与AWMProxy，指控它们大规模以不正当方式爬取Reddit上的内容。而此次Perplexity AI也迅速通过Reddit平台作出回应。

Reddit声称，Perplexity AI，以及美国的SerpApi、立陶宛的Oxylabs UAB和俄罗斯的AWMProxy等数据采集公司，以工业规模且非法的方式从Reddit抓取用户发帖与评论，并将其用于商业用途，特别是用于训练或支持AI搜索/问答系统。其中，SerpApi、Oxylabs UAB及AWMProxy伪装身份、隐藏IP地址，假冒真实用户绕过Reddit的技术防护措施，甚至通过Google搜索结果页面间接抓取Reddit数据。

此外，Reddit还指控Perplexity AI至少是上述某一家公司的客户，购买其采集的数据来构建自身的答案引擎。Reddit已向法院申请禁令，要求禁止被告方使用或出售自Reddit抓取的数据，终止相关行为，并索赔经济损失。

截至目前，Reddit已与OpenAI、Google及Sprinklr等AI企业达成内容授权合作协议，但Perplexity AI始终未与其签署正式授权协议。

然而，就在同一天，Perplexity AI通过Reddit平台反击，指出当公开数据成为上市公司商业模式的重要组成部分时，就注定会出现今天的局面。出售训练数据使用权正逐渐成为Reddit重要的收入来源，外界猜测此次诉讼意在向Google和OpenAI等公司在内容授权谈判中展示强硬姿态。

Perplexity AI澄清，公司并非无视Reddit提出的授权问题，而是曾向对方解释：Perplexity AI属于应用层公司，不会利用任何内容来训练模型，也从未进行过此类操作，因此无法也不应签署内容授权协议。即便如此，Reddit仍坚持要求其付费使用。

Perplexity AI的答案搜索引擎主要功能是搜索网络信息、识别可靠来源，并将资讯整合为清晰、最新的回答，集中呈现用户所需的关键见解。该公司表示，其使用Reddit内容的方式是对讨论内容进行摘要，并在答案中引用相关讨论帖链接。然而，Reddit近期改变了政策，不再允许Perplexity用户在检索过程中访问其公开内容。尽管Reddit认为这是其正当权利，但这一做法被认为违背了开放网络的精神。

不过，目前Reddit超过九成的收入仍来自广告。根据该公司2025年第二季度财报，该季度总收入达5亿美元，同比增长78%，其中广告收入为4.65亿美元，而包括授权在内的其他收入仅为3500万美元。该季度Reddit每股收益为0.48美元。

CB科技站

Reddit起诉Perplexity AI及3家数据爬取公司

Reddit起诉Perplexity AI及三家数据抓取公司

与本文相关的文章