最新消息:关注人工智能 AI赋能新媒体运营

微软、Meta、亚马逊等巨头付费获取维基百科企业级数据访问权

科技资讯 admin 浏览

维基百科25周年,科技巨头争相付费“买数据”

在维基百科迎来25周年之际,一场悄然发生的转变正在发生:曾经免费开放的全球最大百科全书,正通过一项名为“Wikimedia Enterprise”的新服务,向科技巨头收取费用,提供更高效、更稳定的数据接口。谷歌早在2021年就率先加入,如今,微软、Meta、亚马逊、Perplexity和Mistral AI也陆续签约,成为付费合作伙伴。

这不是简单的“数据售卖”。维基媒体基金会并非把整座“知识宝库”打包卖出去,而是针对企业级用户——尤其是那些每天需要处理数亿次查询的AI公司——提供经过清洗、结构化、实时更新的专用API。简单说,普通用户打开维基百科网页看到的是为人类阅读设计的内容;而这些科技公司拿到的,是机器能快速读取、直接用于训练大模型的“干净数据流”。

为什么这些公司愿意掏钱?因为维基百科的数据质量高、覆盖面广、更新及时,且没有版权争议。在AI训练数据越来越稀缺的今天,一个可靠、合法、规模庞大的语料库,比任何算法都更难复制。一位知情人士透露,某家头部AI公司曾内部评估过,使用维基百科数据训练模型的成本,比爬取其他网站低60%以上,且法律风险几乎为零。

维基百科的“生存之道”

维基百科一直以“非营利”和“免费开放”为立身之本。它的运营资金主要来自全球数千万用户的小额捐赠。但随着服务器成本、人员开支和全球合规要求逐年上升,基金会的压力越来越大。2023年,其年度预算已超过1.2亿美元。

Wikimedia Enterprise计划的推出,不是为了“商业化”,而是为了“可持续”。基金会明确表示,所有来自企业客户的收入,100%用于维护网站运行、保障数据安全、支持志愿者社区和开发新工具。2024年第一季度,该计划带来的收入已占基金会总收入的近8%——这在非营利组织中已是可观的补充。

“我们不是在卖内容,”维基媒体基金会收入高级总监在一次内部会议中说,“我们是在为知识的长期可访问性买单。如果AI公司想用我们的数据,那就请公平地支持我们,而不是白嫖。”

用户会受影响吗?

这是很多人最关心的问题:付费给大公司之后,普通用户还能不能免费看维基百科?答案是:当然可以。

Wikimedia Enterprise的服务完全独立于公众访问渠道。普通用户依然可以通过浏览器、手机App或维基百科的API(免费版)获取信息,没有任何限制、没有广告、没有付费墙。企业版只是多了一条“高速通道”,专供那些需要海量、稳定、结构化数据的公司使用。

事实上,这种模式反而保护了普通用户。因为有了企业收入的支撑,基金会不再需要依赖广告或向政府申请补贴,维基百科的中立性和独立性得到了进一步加固。

背后的意义,远不止“数据交易”

这场合作,正在重新定义“公共知识”在数字时代的位置。维基百科不是一家公司,但它所承载的信息,已经成为现代互联网的基础设施——就像电力、自来水一样。

当AI公司用维基百科的数据训练出能回答问题的模型,却从不回馈其源头时,整个系统是失衡的。而Wikimedia Enterprise,正是在尝试修复这种失衡:谁在用知识赚钱,谁就该为知识的持续存在负责。

如今,你打开手机问一句“爱因斯坦的生平”,背后可能是GPT、Claude或通义千问在调用维基百科的API。而你今天捐出的10块钱,或许正和微软的一笔企业合同一起,默默撑着这个页面不被关闭。

维基百科25岁了。它没变成商业巨头,但它学会了在商业世界里,优雅地活下去。