农业古籍断句标点模式研究

被引:28
作者
黄建年
侯汉清
机构
[1] 南京农业大学人文与社会科学学院
关键词
计算机应用; 中文信息处理; 农业古籍; 古农书; 古籍整理; 断句; 标点; 模式匹配;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
农业古籍的整理已经引起了众多学者和专家的注意,但是,对于农业古籍的自动断句、标点模式的研究仍付之阙如。本研究探索并总结出部分农业古籍断句、标点识别模式。首先采用句法特征词断句法、同义语标志词法进行初步断句;进而利用反义复合词、引书标志、时序、数量词、重叠字词、动名结构及比较句法进一步对子句进行断句、标点;最后使用农业用语和禁用模式表进一步提高断句、标点后农业古籍的可读性和准确性。经测试表明,断句、标点的平均准确率分别达到48%和35%,证明本方法具有一定的正确性和可行性。
引用
收藏
页码:31 / 38
页数:8
相关论文
共 7 条