面向XML数据库的智能数据清洗策略

被引:4
作者
刘波 [1 ]
杨路明 [1 ]
雷刚跃 [2 ]
邓云龙 [3 ]
机构
[1] 中南大学信息学院
[2] 湖南信息职业技术学院
[3] 中南大学湘雅附三医院
关键词
XML数据库; 数据清洗; 贝叶斯公式; 马尔可夫链;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
针对XML数据质量问题,通过引入贝叶斯学习方法与马尔可夫链概率转移策略建立XML数据清洗过程的元数据模型,根据综合清洗结构化数据中相似重复记录的思想,提出一种智能清洗XML数据的新方法。实验表明,与其他方法比较,该方法不仅自动化程度较高,降低人工参与的程度,而且精确率和查全率提升了2%5%。
引用
收藏
页码:16 / 18
页数:3
相关论文
共 4 条
[1]   数据清理中同体不同源数据的数化算法研究 [J].
夏骄雄 ;
徐俊 ;
吴耿锋 .
计算机工程, 2007, (01) :71-73
[2]   一种XML相似重复数据的清理方法研究 [J].
陈伟 ;
丁秋林 .
北京航空航天大学学报, 2004, (09) :835-838
[3]   XML文档的相似测度和结构索引研究 [J].
郑仕辉 ;
周傲英 ;
张龙 .
计算机学报, 2003, (09) :1116-1122
[4]  
Consistent data for inconsistent XML document[J] . Zijing Tan,Zijun Zhang,Wei Wang,Baile Shi.Information and Software Technology . 2006 (9)