基于双字词的动态最大匹配分词算法的研究

被引:6
作者
宋国柱 [1 ]
陈俊杰 [2 ]
机构
[1] 山西农业大学现代教育技术学院
[2] 太原理工大学计算机与软件学院
关键词
中文分词; 动态; 最大匹配; 词库;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
通过研究和分析现有最大匹配分词算法,词库结构的设计和分词算法直接关系着分词的速度和效率,提出了一种改进的最大匹配分词算法——基于双字词的动态最大匹配分词算法,设计并实现了汉语分词词库和算法。实验结果表明,此算法相对于现有最大匹配分词算法有显著提高。
引用
收藏
页码:199 / 202
页数:4
相关论文
共 5 条
[1]
中文信息处理技术教程.[M].朱巧明[等]编著;.清华大学出版社.2005,
[2]
信息检索理论与技术.[M].苏新宁主编;.科学技术文献出版社.2004,
[3]
中文分词算法研究 [J].
刘件 ;
魏程 .
微计算机应用, 2008, (08) :11-16
[4]
一种改进的高效分词词典机制 [J].
王东 ;
陈笑蓉 .
贵州大学学报(自然科学版), 2007, (04) :380-384+389
[5]
汉语自动分词研究中的苦干理论问题 [J].
孙茂松 ;
邹嘉彦 .
语言文字应用, 1995, (04)