图书情报领域大模型的应用模式和数据治理

被引：38

作者：

刘倩倩 ^{[1
]}

刘圣婴 ^{[2
]}

刘炜 ^{[1
]}

机构：

[1] 上海图书馆

[2] 华东师范大学图书馆

来源：

图书馆杂志 | 2023年 / 42卷 / 12期

关键词：

大语言模型; 领域大模型; 大模型应用开发; 数据治理; 指令微调; 图书情报;

D O I：

10.13663/j.cnki.lj.2023.12.003

中图分类号：

TP18 [人工智能理论]; G353.1 [情报资料的分析和研究];

学科分类号：

081104 ; 0812 ; 0835 ; 1405 ; 1205 ;

摘要：

本文探讨了图书情报领域大语言模型的应用开发与数据治理要求。大语言模型是依赖海量文本数据，经过无监督预训练及有监督标注数据微调而成。领域大模型则是通用大模型经过领域数据的微调而得到，具备解决领域问题的能力，满足领域应用需求。本文首先回顾了生成式人工智能的突破历程，介绍了大模型的基本原理和应用现状，分析了大模型所具备的多任务能力背后的数据因素和数据需求。最后从数据治理角度重点讨论了领域大模型的应用潜力和方法流程。本文的主要贡献在于分析了图书情报领域大模型的应用模式和数据治理，为图书馆行业应用生成式人工智能技术提供了理论依据和实践指导。同时，文章也讨论了行业大模型应用和评估时需要关注的问题和局限性。

引用

页码：22 / 35

页数：14