惊悚小说家安德里亚·巴茨(Andrea Bartz)星期四在纽约布鲁克林市政区的家中拍摄。
理查德·德鲁/美联社
隐藏字幕
切换标题
理查德·德鲁/美联社
纽约 – 人工智能公司Anthropic已同意支付15亿美元,以解决书籍作者的集体诉讼,他们说该公司拿了盗版的副本来培训其聊天机器人。
地标性和解,如果在周一获得法官的批准,可以标志着AI公司与作家,视觉艺术家和其他指责他们侵犯版权的创意专业人士之间法律斗争的转折点。
该公司已同意向作者支付约3,000美元的估计涵盖的和解协议所涵盖的书。
作者的律师贾斯汀·尼尔森(Justin Nelson)说:“尽可能最好,这是有史以来最大的版权恢复。” “这是AI时代的第一个。”
三名作家 – 惊悚小说家安德里亚·巴茨(Andrea Bartz)和非小说作家查尔斯·格雷伯(Charles Graeber)和柯克·华莱士·约翰逊(Kirk Wallace Johnson)于去年起诉,现在代表了一群更广泛的作家和出版商,其书籍人道上的书籍下载了训练聊天机器人克劳德(Claude)。
拟人网站和手机应用程序在2024年7月5日在纽约这张照片中显示。
理查德·德鲁/美联社
隐藏字幕
切换标题
理查德·德鲁/美联社
一名联邦法官在6月对此案进行了裁决,发现对受版权书籍的AI聊天机器人培训并非违法,但该人类通过海盗网站错误地获取了数百万本书。
如果人类尚未解决,专家说,在预定的12月审判后输掉此案可能会使这家总部位于旧金山的公司损失更多的钱。
沃尔特斯·克鲁沃尔(Wolters Kluwer)的法律分析师威廉·朗(William Long)说:“我们正在考虑有数十亿美元的强烈可能性,足以使可能瘫痪,甚至使人类倒闭。”
旧金山的美国地方法院法官威廉·阿尔苏普(William Alsup)安排了周一的听证会,以审查和解条款。
Anthropic在周五的一份声明中说,该和解,如果获得批准,“将解决原告的剩余遗产索赔”。
该公司副律师Aparna Sridhar说:“我们仍然致力于开发安全的AI系统,以帮助人们和组织扩展其能力,提高科学发现并解决复杂的问题。”
作为解决方案的一部分,该公司还同意销毁其下载的原始书籍文件。
众所周知,书籍是重要的数据来源 – 本质上,数十亿个单词仔细地串在一起,这些单词是在聊天机器人背后建立AI大语言模型所需的,例如Anthropic的Claude及其主要竞争对手Openai的Chatgpt。
Alsup的六月裁决发现,拟人化下载了超过700万个数字化的书籍,“知道已被盗版”。它始于一个名为Books3的在线图书馆的近200,000,该图书馆由Openai以外的AI研究人员组成,以匹配对Chatgpt受过培训的庞大藏书。
首张惊悚小说 失落的夜晚 Bartz是该案的主要原告,是Books3数据集中发现的。
Alsup写道,拟人化后来从海盗网站Genesis或Libgen获得了至少500万张副本,并从海盗图书馆镜像中获得了至少200万份。
作者协会上个月告诉成千上万的成员,预计如果在审判中发现人类会故意侵犯其版权,则“损害赔偿将最少$ 750,可能会更高”。解决方案的较高奖项(每项工作约为3,000美元)可能会反映出较小的受影响的书籍,并在没有版权的情况下进行了重复。
周五,作者协会首席执行官玛丽·拉森伯格(Mary Rasenberger)称该和解为“对作者,出版商和右股份的绝佳结果,向AI行业传达了强烈的信息,即当他们盗版作者在训练AI训练自己的AI,抢劫最不可能的人时,他们会产生严重的后果。”
丹麦权利联盟(Danish Priental Alliance)成功地击败了其中一个影子图书馆,周五表示,和解协议对未在美国版权所有的作品注册的欧洲作家和出版商无济于事。
该集团内容保护和执法负责人托马斯·赫德鲁普(Thomas Heldrup)表示:“一方面,令人欣慰的是,通过从已知的非法档案共享网站下载数百万本书来编译AI培训数据集的价格是有代价的。”
另一方面,Heldrup表示,它适合一本技术行业的剧本,可以先发展一家业务,然后与业务规模相比,以违反规则的规定,罚款相对较小。
Heldrup说:“我的理解是,这些公司将像拟人化的定居点视为在竞争激烈的空间中开展业务的代价。”
私有的人类人的拟人化,由前奥奈领导人于2021年创立,本周早些时候,其价值为1830亿美元,此前又筹集了130亿美元的投资。
Anthropic还表示,它预计今年将进行50亿美元的销售额,但是,与OpenAI和许多其他AI初创公司一样,它从未报告过获利,而是依靠投资者支持开发AI技术的高昂成本来期望未来的回报。
该和解可能会影响其他纠纷,包括作者和报纸针对Openai及其业务伙伴Microsoft的诉讼。
法律分析师朗说:“这表明也许对于其他情况,创作者和人工智能公司就可以达成和解,而无需在法庭上破产。”
该行业,包括人类,在很大程度上赞扬了Alsup的6月份裁决,因为他发现对受版权保护的作品进行了训练AI系统,因此聊天机器人可以根据美国版权法制作自己的文本文本段落,因为它是“典型的变革性”。
Alsup将AI模型与“任何渴望成为作家的读者”进行了比较,Alsup写道,拟人化的“训练有素”的作品不得向前竞赛,复制或取代他们,而是要转弯并创造出不同的东西。”
但是在法庭上披露的文件显示,拟人化员工对使用海盗站点的合法性的内部担忧。该公司后来改变了其方法,并聘请了前Google主管汤姆·图里(Tom Turvey),负责Google Books,这是一个可搜索的数字化书籍库,成功地度过了版权战的数年。
根据法庭文件,在他的帮助下,拟人化开始批量购买书籍,撕下绑定并扫描每页,然后将数字化版本喂入其AI模型。法官说,但这并没有撤消较早的盗版。
关键词: