简介:
《信息文萃》是一本图书馆内部发行刊物,于2000年创刊,每年出版16期,由财经、高教和读书思考三个栏目组成,每期共8个版面,包括教育类4版,财经类3版,读书思考1版。至今已出版261期。《信息文萃》精心选摘与主题相关的时事要闻、经典评论,将初步筛选的信息编辑整理,《信息文萃》以读者需求为中心,紧跟时代脉搏,关注时势热点,求真务实,受到广大读者的喜爱。人工智能驱动的图书馆编目领域新进展
摘录:南京财经大学图书馆 更新日期:2026年06月23日 10:34 类别:图情天地 总浏览:0
编目作为图书馆资源组织与描述的关键环节,是人工智能技术在图书馆落地与应用的重要场景。本文基于系统的文献梳理与典型案例分析,从行业组织、系统提供商、学术界与图书馆四个维度,呈现AI在编目领域的创新实践与发展动态。围绕技术选型、AI编目准确率、编目员能力与角色转型等关键问题提出建议措施。
应用场景
图书馆在编目领域应用AI主要有3种场景:(1)生成书目记录。通常包括生成题名与责任者、ISBN、出版发行地、出版发行者、出版年等基础描述性元数据;其中,一种是生成 MARC 格式的书目数据,如圣地亚哥州立大学图书馆利用ChatGPT生成符合RDA规则的MARC21格式记录,广东省立中山图书馆“采编图灵”生成CNMARC格式记录。另一种是生成BIBFRAME格式的书目数据,如比利时皇家图书馆实现了自动生成BIBFRAME格式的书目数据。(2)主题标引与分类标引。主题标引通常依托特定的主题词表,如汉语主题词表、美国国会图书馆主题词(Library of Congress Subject Headings, LCSH)、分面应用主题词(Faceted Application of Subject Terminology, FAST)等。分类标引则根据特定分类体系分配分类号,如中国图书馆分类法等。(3)实体识别与提取。当前实体识别与提取实践多在特藏资源中展开,利用 AI 自动抽取特藏资源中的人物、机构、地名、时间、主题概念等关键知识单元,为知识图谱构建、语义检索和智能问答提供数据基础。典型案例如先秦文化元典智能问答项目利用DeepSeek-R1大模型根据本体模型自动抽取先秦文化元典知识,构建先秦文化元典知识图谱。
多主体关注与参与
图书馆界多主体关注AI在编目领域的发展,形成了行业组织、系统提供商、学术界与
图书馆之间的协同互动格局。国内外各主体在推进AI编目进程中呈现出一定共性和差异。
共性主要体现在:(1)技术研发上,国内外系统提供商均已推出针对编目需求的AI解决方案与产品。(2)在理论探索层面,国内外学术界均对AI在编目领域应用的可行性开展了实验性研究与理论探讨,为AI编目提供理论创新与方法支撑。
差异主要体现在:(1)标准制定上,国外编目领域行业组织较为积极,较多开展环境扫描、制定标准指南并提供专业能力要求,相比之下,国内编目领域相关组织较少开展相应部署与行动。(2)在实践场景上,国外图书馆在传统编目业务中积极试验并应用AI生成书目记录,开展主题与分类标引,部分机构如比利时皇家图书馆、德国国家图书馆已将AI嵌入实际编目流程并形成相对稳定的工作机制。国内图书馆则相对聚焦于利用AI识别与抽取特藏资源实体,将其作为特藏资源描述与组织的基础,从而推动特藏资源的开发与利用。这与国内政策导向有一定关联。近年来国家层面强调中华优秀传统文化遗产的数字化保护与传播,特藏资源尤其是古籍成为AI应用的重点对象。(3)在AI技术工具应用上,国内外图书馆倾向选择适合处理本国语种资源的本土化AI工具。
早期探索与应用并行
当前,AI应用于编目的整体现状表现为:大多图书馆仍处于早期探索阶段,仅少数图
书馆开展实际应用。这一现状主要受制于两方面的因素:从技术层面看,生成式AI等关键技术本身仍处于快速迭代的发展期,其在编目实践中的准确性、可靠性与成本效益还有待验证;从实施层面看,各图书馆在资金投入、技术储备与人才结构方面存在一定差异,多数图书馆仍缺乏将前沿AI技术整合进既有工作流程的系统性能力。
处于早期探索阶段的图书馆通常利用大语言模型以较低成本方式,基于馆藏图书全文内
容及书目记录数据开展实验,探索AI在生成书目记录、主题与分类标引等场景中的可行性。典型案例如国内部分图书馆利用AI对特藏资源实体进行识别与提取,以及美国国会图书馆、圣地亚哥州立大学图书馆、香港浸会大学图书馆等。处于应用阶段的图书馆通常依托其雄厚的技术实力、大规模训练数据优势以及多年坚持不懈的探索积淀。典型案例如国内南京农业大学“荀子”古籍大语言模型,该项目组自 2013年以来持续专注于人工精细标注,积累了约40亿字大型混合语料,为模型训练提供了重要数据基础。
机遇与挑战并存
AI在图书馆编目领域的应用,为图书馆带来了一定变革,也带来诸多挑战,可谓机遇与挑战并存。带来的机遇主要包括:(1)提升编目效率。AI通过生成结构化元数据,已成为图书馆应对海量资源、提升编目效率的重要辅助工具。如比利时皇家图书馆(KBR)利用
AI为1.9万册纸质图书生成标准化书目数据,补全在线目录缺失信息。广东省立中山图书馆应用“采编图灵”系统,实现图书上架时效从两三天压缩至10分钟。在主题标引环节,AI可自动分析资源内容并生成主题建议供人工复核。如德国国家图书馆借助Annif工具,2023年为15万余种数字出版物自动分配GND主题词,大幅提升主题标引效率。(2)重塑编目流程。AI 技术推动编目流程由纯人工向人机协同转变。AI 可嵌入描述性著录和主题标引与分类标引等环节,自动提取和生成元数据。然而,编目员的专业参与仍不可或缺,尤其在涉及复杂的编目规则、主题词表和分类体系等规范内容时,需对模型输出进行评估和修订。设计并优化人机协同编目工作流程将是未来编目工作转型的方向。(3)变革资源检索方式。AI通过对资源内容中人物、地名、机构、时间、事件、主题等实体的精准识别,能够为知识图谱构建与智能语义检索提供支持,推动图书馆检索方式由基于字段和规则的检索向语义驱动的智能检索转型。
带来的问题与挑战主要有:(1)元数据准确性问题:AI 生成元数据的质量仍存在诸多
问题,尤其在复杂编目规则、特藏资源(如手稿、古籍、地图等)等情境下难以达到专业编目
质量要求。(2)数据质量依赖:AI模型性能受训练数据质量影响,低质量或过时数据可能导致偏差。(3)伦理与隐私风险:AI处理敏感信息时可能泄露隐私,且算法偏见可能加剧资源描述的不公平性。(4)技术整合与成本难题:现有图书馆系统(如 ILS)与AI工具的兼容性不足,需高额投入升级基础设施。此外,AI技术发展快,图书馆需持续跟进和更新,购买与维护AI 系统成本高昂。(5)人员技能差距:AI应用对编目员的能力提出了新要求与新挑战。编目员需深入理解 AI 技术,掌握提示词工程、模型评估及系统管理等新技能,但当前多数编目员缺乏 AI 技术背景,在算法逻辑理解、工具应用等方面存在能力缺口。
(摘自《图书馆杂志》网络首发:2026年6月9日)
最新文章 TOP10
热门文章 TOP10
