波士顿公共图书馆的堆栈是该国最古老,最大的公共图书馆系统之一。
波士顿公共图书馆的Aram Boghosian
隐藏字幕
切换标题
波士顿公共图书馆的Aram Boghosian
波士顿公共图书馆是该国最古老,最大的公共图书馆系统之一,他将于今年夏天与OpenAI和哈佛大学法学院一起启动一个项目,以使其历史上重要的政府文件更容易被公众访问。
这些文件可以追溯到1800年代初期,包括口述历史,国会报告以及对不同行业和社区的调查。
波士顿公共图书馆数字和在线服务负责人杰西卡·教堂(Jessica Chapel)表示:“这确实是一个令人难以置信的主要资源材料存储库,涵盖了美国通过政府出版物所表达的整个历史。”
目前,想要访问这些文件的公众必须亲自出现。该项目将增强每个文档的元数据,并使用户能够从世界任何地方搜索和交叉引用整个文本。
教堂说,波士顿公共图书馆计划在今年年底之前数字化5,000个文件,如果一切顺利,请从那里发展该项目。
与AI讨价还价
由于这个历史悠久的收藏的规模和脆弱性,实现这一目标是一个艰巨的过程。每个项目都必须手动通过扫描仪运行。完成300-400页大约需要一个小时。
一本书在波士顿公共图书馆的扫描仪中经历了数字化过程。
波士顿公共图书馆
隐藏字幕
切换标题
波士顿公共图书馆
哈佛大学说,这可能会有所帮助。哈佛法学院图书馆的机构数据计划的研究人员正在与图书馆,博物馆和档案馆合作许多方面,包括培训新的AI模型,以帮助图书馆增强其馆藏的可搜索性。
人工智能公司帮助这些努力资助,作为回报,可以培训其大型语言模型,这些模型涉及版权的高质量材料,因此导致诉讼的可能性较小。 (Microsoft和Openai是最近受版权侵权诉讼的众多AI参与者之一,在该诉讼中,作者等原告声称这些公司未经许可就偷走了作品。)
Microsoft知识产权集团副总裁伯顿·戴维斯(Burton Davis)表示:“拥有为AI构建可持续数据生态系统的图书馆之类的信息机构至关重要,因为它不仅可以改善我们可用的数据量,还可以提高数据质量以及我们对其中的知识的理解。”
所有人的访问
哈佛法学院图书馆的机构数据倡议的执行董事格雷格·莱珀特(Greg Leppert)表示,该计划并不是授予AI公司在图书馆和档案馆中持有的富裕信息信息的富裕人士的访问权。将数据数字化后,任何人都可以访问数据。
Leppert说:“这是一条双向街道,我们正在以有助于AI的方式改进数据,但这些改进又回到了图书馆。” “因此,它也改善了顾客体验。”
OpenAI正在帮助波士顿公共图书馆支付扫描和项目管理等费用。科技公司没有数字化数据的专有权。
该公司在向NPR的一份声明中说:“我们像其他人一样,从他们对公共领域进行数字化的努力,扩大了包括我们在内的AI系统可以在内的高质量数据和公共知识的努力。”
公私伙伴关系的挑战
图书馆专业人士说,与AI公司合作将提供更广泛的信息访问。
波士顿公共图书馆的教堂说:“我认为这是一个非常有价值的合作伙伴关系,我们将获得更容易获得的收藏。”
而且,由于图书馆员参与策划和分类这些信息,因此可以更容易保护AI公司使用的材料的完整性。
美国图书馆协会主席萨姆·赫尔米克(Sam Helmick)说:“在我们开始发展未来将带来的一切时,经过深入的主题知识的训练有素的专业人员至关重要。”
但是图书馆专家还对这些伙伴关系表示谨慎,因为公共机构和公司之间存在文化差异。
这本新书的合着者迈克尔·汉尼根(Michael Hanegan)说:“这种快速移动并破坏事物'的硅谷的精神与图书馆管理的价值观背道而驰,这与获取和透明度有关。” 生成的AI和图书馆。
教堂说:“这一切都如此之快:技术正在迅速发展。公司的行驶速度很快。” “而且图书馆在一个截然不同的时间表上工作。所以有一点文化冲突。”
詹妮弗·瓦纳斯科(Jennifer Vanasco)编辑了这个故事,以供广播和数字化。
关键词: