一种改进的Wu-Manber多模式匹配算法及应用

被引:40
作者
孙晓山
王强
关毅
王晓龙
机构
[1] 哈尔滨工业大学计算机学院
关键词
计算机应用; 中文信息处理; 多模式匹配; 后缀模式; 字符串匹配; 全文检索; 信息检索;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
080201 [机械制造及其自动化];
摘要
本文针对Wu-Manber多模式匹配算法在处理后缀模式情况下的不足,给出了一种改进的后缀模式处理算法,减少了匹配过程中字符比较的次数,提高了算法的运行效率。本文在随机选择的TREC2000的52,067篇文档上进行了全文检索实验,对比了Wu-Manber算法、使用后缀模式的改进算法、不使用后缀模式的简单改进等三种算法的匹配过程中字符比较的次数。实验结果说明,本文的改进能够比较稳定的减少匹配过程中字符比较的次数,提高匹配的速度和效率。
引用
收藏
页码:47 / 52
页数:6
相关论文
共 3 条
[1]
快速中文字符串模糊匹配算法 [J].
陈开渠 ;
赵洁 ;
彭志威 .
中文信息学报, 2004, (02) :58-65
[2]
一种改进的Wu-Manber多关键词匹配算法 [J].
张鑫 ;
谭建龙 ;
程学旗 .
计算机应用, 2003, (07) :29-31
[3]
一种优化的并行汉字/字符串匹配算法 [J].
王素琴 ;
邹旭楷 .
中文信息学报, 1995, (01)