数据清理中编辑距离的应用及Java编程实现

被引:8
作者
陈伟
丁秋林
机构
[1] 南京航空航天大学计算机应用研究所
[2] 南京航空航天大学计算机应用研究所 南京
[3] 南京
关键词
数据清理; 相似重复记录; 编辑距离; Java;
D O I
10.19414/j.cnki.1005-1228.2003.06.008
中图分类号
TP311.1 [程序设计];
学科分类号
081202 ; 0835 ;
摘要
根据企业信息化建设的现状 ,阐述了编辑距离算法在数据清理中的重要作用。在分析了编辑距离算法原理的基础上 ,用 Java程序实现了编辑距离算法。
引用
收藏
页码:33 / 35+60 +60
页数:4
相关论文
共 1 条
[1]  
On the Weighted Mean of a Pair of Strings[J] . Horst Bunke,Xiaoyi Jiang,Karin Abegglen,Abraham Kandel.Pattern Analysis & Applications . 2002 (1)