波士顿公共图书馆旨在使用AI:NPR增加获得庞大的历史档案馆的访问权限


波士顿公共图书馆的堆栈是该国最古老,最大的公共图书馆系统之一。

波士顿公共图书馆的Aram Boghosian

隐藏字幕

切换标题

波士顿公共图书馆的Aram Boghosian

波士顿公共图书馆是该国最古老,最大的公共图书馆系统之一,他将于今年夏天与OpenAI和哈佛大学法学院一起启动一个项目,以使其历史上重要的政府文件更容易被公众访问。

这些文件可以追溯到1800年代初期,包括口述历史,国会报告以及对不同行业和社区的调查。

波士顿公共图书馆数字和在线服务负责人杰西卡·教堂(Jessica Chapel)表示:“这确实是一个令人难以置信的主要资源材料存储库,涵盖了美国通过政府出版物所表达的整个历史。”

目前,想要访问这些文件的公众必须亲自出现。该项目将增强每个文档的元数据,并使用户能够从世界任何地方搜索和交叉引用整个文本。

教堂说,波士顿公共图书馆计划在今年年底之前数字化5,000个文件,如果一切顺利,请从那里发展该项目。

与AI讨价还价

由于这个历史悠久的收藏的规模和脆弱性,实现这一目标是一个艰巨的过程。每个项目都必须手动通过扫描仪运行。完成300-400页大约需要一个小时。

一本书在波士顿公共图书馆的扫描仪中经历了数字化过程。

波士顿公共图书馆


隐藏字幕

切换标题

波士顿公共图书馆

哈佛大学说,这可能会有所帮助。哈佛法学院图书馆的机构数据计划的研究人员正在与图书馆,博物馆和档案馆合作许多方面,包括培训新的AI模型,以帮助图书馆增强其馆藏的可搜索性。

人工智能公司帮助这些努力资助,作为回报,可以培训其大型语言模型,这些模型涉及版权的高质量材料,因此导致诉讼的可能性较小。 (Microsoft和Openai是最近受版权侵权诉讼的众多AI参与者之一,在该诉讼中,作者等原告声称这些公司未经许可就偷走了作品。)

Microsoft知识产权集团副总裁伯顿·戴维斯(Burton Davis)表示:“拥有为AI构建可持续数据生态系统的图书馆之类的信息机构至关重要,因为它不仅可以改善我们可用的数据量,还可以提高数据质量以及我们对其中的知识的理解。”

所有人的访问

哈佛法学院图书馆的机构数据倡议的执行董事格雷格·莱珀特(Greg Leppert)表示,该计划并不是授予AI公司在图书馆和档案馆中持有的富裕信息信息的富裕人士的访问权。将数据数字化后,任何人都可以访问数据。

Leppert说:“这是一条双向街道,我们正在以有助于AI的方式改进数据,但这些改进又回到了图书馆。” “因此,它也改善了顾客体验。”

OpenAI正在帮助波士顿公共图书馆支付扫描和项目管理等费用。科技公司没有数字化数据的专有权。

该公司在向NPR的一份声明中说:“我们像其他人一样,从他们对公共领域进行数字化的努力,扩大了包括我们在内的AI系统可以在内的高质量数据和公共知识的努力。”

公私伙伴关系的挑战

图书馆专业人士说,与AI公司合作将提供更广泛的信息访问。

波士顿公共图书馆的教堂说:“我认为这是一个非常有价值的合作伙伴关系,我们将获得更容易获得的收藏。”

而且,由于图书馆员参与策划和分类这些信息,因此可以更容易保护AI公司使用的材料的完整性。

美国图书馆协会主席萨姆·赫尔米克(Sam Helmick)说:“在我们开始发展未来将带来的一切时,经过深入的主题知识的训练有素的专业人员至关重要。”

但是图书馆专家还对这些伙伴关系表示谨慎,因为公共机构和公司之间存在文化差异。

这本新书的合着者迈克尔·汉尼根(Michael Hanegan)说:“这种快速移动并破坏事物'的硅谷的精神与图书馆管理的价值观背道而驰,这与获取和透明度有关。” 生成的AI和图书馆

教堂说:“这一切都如此之快:技术正在迅速发展。公司的行驶速度很快。” “而且图书馆在一个截然不同的时间表上工作。所以有一点文化冲突。”

詹妮弗·瓦纳斯科(Jennifer Vanasco)编辑了这个故事,以供广播和数字化。



关键词:

波士顿公共图书馆旨在使用AINPR增加获得庞大的历史档案馆的访问权限
Comments (0)
Add Comment