学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
面向XML数据库的智能数据清洗策略
被引:4
作者
:
刘波
论文数:
0
引用数:
0
h-index:
0
机构:
中南大学信息学院
中南大学信息学院
刘波
[
1
]
杨路明
论文数:
0
引用数:
0
h-index:
0
机构:
中南大学信息学院
中南大学信息学院
杨路明
[
1
]
雷刚跃
论文数:
0
引用数:
0
h-index:
0
机构:
湖南信息职业技术学院
中南大学信息学院
雷刚跃
[
2
]
邓云龙
论文数:
0
引用数:
0
h-index:
0
机构:
中南大学湘雅附三医院
中南大学信息学院
邓云龙
[
3
]
机构
:
[1]
中南大学信息学院
[2]
湖南信息职业技术学院
[3]
中南大学湘雅附三医院
来源
:
计算机工程
|
2008年
/ 16期
关键词
:
XML数据库;
数据清洗;
贝叶斯公式;
马尔可夫链;
D O I
:
暂无
中图分类号
:
TP311.13 [];
学科分类号
:
1201 ;
摘要
:
针对XML数据质量问题,通过引入贝叶斯学习方法与马尔可夫链概率转移策略建立XML数据清洗过程的元数据模型,根据综合清洗结构化数据中相似重复记录的思想,提出一种智能清洗XML数据的新方法。实验表明,与其他方法比较,该方法不仅自动化程度较高,降低人工参与的程度,而且精确率和查全率提升了2%5%。
引用
收藏
页码:16 / 18
页数:3
相关论文
共 4 条
[1]
数据清理中同体不同源数据的数化算法研究
[J].
论文数:
引用数:
h-index:
机构:
夏骄雄
;
论文数:
引用数:
h-index:
机构:
徐俊
;
论文数:
引用数:
h-index:
机构:
吴耿锋
.
计算机工程,
2007,
(01)
:71
-73
[2]
一种XML相似重复数据的清理方法研究
[J].
论文数:
引用数:
h-index:
机构:
陈伟
;
丁秋林
论文数:
0
引用数:
0
h-index:
0
机构:
南京航空航天大学计算机应用研究所
丁秋林
.
北京航空航天大学学报,
2004,
(09)
:835
-838
[3]
XML文档的相似测度和结构索引研究
[J].
郑仕辉
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学计算机科学与工程系
郑仕辉
;
论文数:
引用数:
h-index:
机构:
周傲英
;
论文数:
引用数:
h-index:
机构:
张龙
.
计算机学报,
2003,
(09)
:1116
-1122
[4]
Consistent data for inconsistent XML document[J] . Zijing Tan,Zijun Zhang,Wei Wang,Baile Shi.Information and Software Technology . 2006 (9)
←
1
→
共 4 条
[1]
数据清理中同体不同源数据的数化算法研究
[J].
论文数:
引用数:
h-index:
机构:
夏骄雄
;
论文数:
引用数:
h-index:
机构:
徐俊
;
论文数:
引用数:
h-index:
机构:
吴耿锋
.
计算机工程,
2007,
(01)
:71
-73
[2]
一种XML相似重复数据的清理方法研究
[J].
论文数:
引用数:
h-index:
机构:
陈伟
;
丁秋林
论文数:
0
引用数:
0
h-index:
0
机构:
南京航空航天大学计算机应用研究所
丁秋林
.
北京航空航天大学学报,
2004,
(09)
:835
-838
[3]
XML文档的相似测度和结构索引研究
[J].
郑仕辉
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学计算机科学与工程系
郑仕辉
;
论文数:
引用数:
h-index:
机构:
周傲英
;
论文数:
引用数:
h-index:
机构:
张龙
.
计算机学报,
2003,
(09)
:1116
-1122
[4]
Consistent data for inconsistent XML document[J] . Zijing Tan,Zijun Zhang,Wei Wang,Baile Shi.Information and Software Technology . 2006 (9)
←
1
→