古籍版本异文的自动发现

被引:11
作者
肖磊
陈小荷
机构
[1] 南京师范大学文学院
关键词
古籍; 版本异文; 句珠; 相似度;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
该文提出了古籍版本异文自动发现方法:首先由bigram计算得到句珠相似度,根据相似度发现最有可能的句珠配对,然后在异文句珠中不断地去掉最长"同文"并输出异文。研究个案是三传春秋经,结果表明,句珠配对全部正确,异文配对算法也能够正确发现全部符合定义的异文。
引用
收藏
页码:50 / 55
页数:6
相关论文
共 4 条
[1]   一种改进的编辑距离算法及其在数据处理中的应用 [J].
赵作鹏 ;
尹志民 ;
王潜平 ;
许新征 ;
江海峰 .
计算机应用, 2009, 29 (02) :424-426
[2]   古籍自动校勘的研究和实现 [J].
常娥 ;
侯汉清 ;
曹玲 .
中文信息学报, 2007, (02) :83-88
[3]   大型中文古籍《四库全书》自动版面分析系统 [J].
姜哲 ;
马少平 ;
夏莹 .
中文信息学报, 2000, (02) :14-20
[4]  
汉语信息处理研究[M]. 北京语言学院出版社 , 张普著, 1992