一种改进的编辑距离算法及其在数据处理中的应用

被引:52
作者
赵作鹏 [1 ,2 ]
尹志民 [3 ]
王潜平 [2 ]
许新征 [2 ]
江海峰 [2 ]
机构
[1] 北京大学遥感与地理信息系统研究所
[2] 中国矿业大学计算机科学与技术学院
[3] 冀中能源集团股份有限公司
关键词
编辑距离; 字符串相似匹配; 数据处理;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
081202 ;
摘要
基于数据处理的需要,在分析原有编辑距离算法的基础上,通过拓展交换操作减少编辑操作的数量。与仅对计算点之前相邻位置字符间的交换操作相比,通过对计算点前后非相邻位置字符间的交换操作改进该算法,能够得到更理想化的编辑距离。将改进的编辑距离算法应用于煤矿隐患数据的处理,提高了隐患数据分类分级的有效性和执行效率。
引用
收藏
页码:424 / 426
页数:3
相关论文
共 3 条
[1]   基于网络处理器的高速字符串匹配 [J].
余建明 ;
徐波 ;
薛一波 .
清华大学学报(自然科学版), 2008, (04) :589-591
[2]  
基于多层特征的字符串相似度计算模型[J]. 章成志.情报学报. 2005 (06)
[3]  
An Extension of the String-to-String Correction Problem[J] . Robert A. Wagner,Roy Lowrance.Journal of the ACM (JACM) . 1975 (2)