古籍数字化关键技术评述

被引:15
作者
苏祺 [1 ]
胡韧奋 [2 ]
诸雨辰 [3 ]
严承希 [4 ]
王军 [1 ]
机构
[1] 北京大学数字人文中心
[2] 北京师范大学中文信息处理研究所
[3] 北京师范大学文学院
[4] 不详
关键词
古籍整理; 古籍数字化; 自然语言处理; 数字人文;
D O I
暂无
中图分类号
G255.1 [善本、线装古籍];
学科分类号
050104 ; 060202 ;
摘要
中国历史文化典籍是中华民族的宝贵财富。在数字环境下,实现古籍的数字化整理与利用,能够为数字人文研究、历史学研究及其他人文研究提供基础性资源,也是推动中华文明创造性转化与创新性发展的重要依托。古籍的数字化整理包括纸本资源的电子化,以及在电子化文本基础上的断句、标点、词语切分等基础性加工和深层知识提取。本文对现有古籍数字化整理的技术方法与平台进行梳理与评述,分析古籍数字化整理的挑战,探讨古籍数字化整理任务的未来发展方向。
引用
收藏
页码:83 / 88
页数:6
相关论文
共 19 条