基于动态规划的缩写发现算法

被引:2
作者
李华
易宝林
桂浩
机构
[1] 华中科技大学计算机科学与技术学院
[2] 华中科技大学计算机科学与技术学院 湖北武汉
[3] 湖北武汉
关键词
数据清理; 动态规划; 缩写发现算法; 字符串相似匹配;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
数据清理中重复记录的识别一般采用动态规划算法或过滤算法,然而很少算法考虑了数据中的缩写问题,因此容易漏掉一些重复记录,影响了数据清理的质量,因此在动态规划的基础上提出了缩写发现算法,同已有算法相比,它的算法复杂度较小,而且能够发现汉语等无分隔符的语言中的缩写,最后给出了缩写情况下判断字符串近似匹配的方法.
引用
收藏
页码:128 / 131
页数:4
相关论文
共 2 条
[1]  
Finding approximate patterns in strings. Ukkonen E. Journal of Algorithms . 1985
[2]  
Very fast and simple approximate string matching. Gonzalo Navarro,Ricardo Baeza-Yates. Information Processing Letters . 1999