一个在担任 Mumsnet 创始人近 25 年之后,我认为自己对大型科技的运作毫不感到震惊。但上周,当我读到谷歌正在推动彻底修改英国版权法时,我的下巴惊到了地上,这将允许它在没有补偿的情况下自由挖掘其他出版商的内容以获得商业利益。
在 Mumsnet,我们一直走在这种做法的前沿,最近对科技巨头 OpenAI 发起了英国首个法律诉讼。今年早些时候,我们意识到它正在抓取我们的内容——可能是为了训练其大型语言模型 (LLM)。这种未经许可的抓取行为违反了版权法并明确违反了我们的使用条款,因此我们联系了 OpenAI 并建议达成许可协议。经过长时间的谈判(并签署了一份保密协议),它告诉我们它不感兴趣,并称它是在寻找“不太开放”的数据源。
您可能会问,为什么为模型训练而提升在线内容会带来问题——自互联网诞生以来,谷歌不是一直在整个网站上爬行并获取其数据以用于搜索目的吗?确实如此,但允许谷歌访问该数据存在明显的价值交换,即由谷歌索引产生的搜索流量。相比之下,法学硕士正在构建诸如 ChatGPT 之类的模型来为任何和所有潜在问题提供答案,这将意味着人们不再需要去其他地方寻求解决方案。他们正在使用从他们准备取代的网站上非法抓取的内容来构建这些模型。
允许人工智能公司简单地窃取内容不仅对那些认为自己投入的工作或承担的风险没有任何回报的出版商非常不公平,而且对他们来说也是一种生存威胁(最终会适得其反)。如果出版商因为人工智能吸走了他们所有的流量而衰亡,那么谁还能生产内容来喂养模型呢?老实说,这些科技巨头并不是无力向出版商提供适当的补偿。 OpenAI 目前正在筹集 65 亿美元的资金,这是有史以来最大的单轮风险投资,该企业的估值高达 1500 亿美元。事实上,刚刚有报道称,该公司正计划改变结构,成为一家营利性企业。
一些拥有法律和财务实力的大型出版商已成功与人工智能巨头达成许可协议,其他几家出版商正在提起诉讼,试图保护自己的权利。但如果谷歌等人按照版权法行事,较小的出版商将排在最后,可能永远不会得到补偿。
在 Mumsnet,我们实际上比大多数人更能抵御人工智能的攻击,因为我们的大部分流量都是直接到达我们的,而不是通过搜索引擎。人工智能聊天机器人可以对育儿问题给出“妈妈网式”的答案,但它们永远不会对停车大战那么有趣,或者对人际关系那么残酷诚实,而且它们肯定永远不会提供大约 1,000 人的情感支持。根据我们的估计,女性每年帮助摆脱其他 Mumsnet 用户的虐待伴侣。但如果允许这些价值数万亿美元的巨头对内容生产商进行粗暴对待,并且逍遥法外,他们将摧毁其中的许多人,以及所有依赖他们的就业机会。
我并不反对人工智能。显然,它有潜力以多种方式推动人类进步并改善我们的生活。我们在 Mumsnet 中使用它来构建 MumsGPT,它揭示并总结了父母的想法——从美容趋势到超市再到政治家——我们授权 OpenAI 的 API(应用程序编程接口)来构建它。另外,我们认为这些人工智能模型应该摄取 Mumsnet 的对话来训练他们的模型有一些很好的理由。 Mumsnet 上超过 60 亿的单词是 24 年来女性互动的独特记录,内容涉及从全球政治到与姻亲关系等各个方面。相比之下,网络上的大部分内容都是由男性编写并为男性服务的。人工智能模型存在厌女症,我们很乐意帮助消除他们的性别偏见。
但谷歌修改法律的提议将允许价值数十亿美元的公司以快速“发展”的名义不受限制地进行任何公平价值交换的概念。小型出版商网站的所有独特和辉煌都将丢失,而少数硅谷巨头将对世界内容和商业拥有更多控制权。
事情不一定是这样的——有足够多的资金涌入人工智能公司,让每个人的贡献都能得到公平和可持续的回报。但我们,我指的是出版业和政府,需要醒来并闻到咖啡的味道,因为正如最近在美国进行的谷歌反垄断审判所表明的那样,如果让大型科技公司自行其是,他们将很乐意践踏法律以增强他们的统治地位。
关键词: