基于D-S证据理论的不确定数据清洗

被引:6
作者
樊金辉
岳昆
张骥先
刘惟一
机构
[1] 云南大学信息学院计算机科学与工程系
关键词
不确定数据; 数据清洗; 错误检测; D-S证据理论; 置信区间;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
数据清洗的任务是检测数据中存在的错误、缺失或不一致,通过删除、填充、修改等方法提高数据质量.针对存在元组级不确定性的数据表上的选择投影连接操作,基于D-S证据理论中置信区间的概念,给出辨识框架构建和置信区间计算的方法,提出了一种基于待测数据项置信区间来检测查询结果中错误数据的方法.实验结果表明,提出的不确定数据错误检测方法具有高效性、准确性和可用性.
引用
收藏
页码:815 / 822
页数:8
相关论文
共 5 条
[1]   基于信息熵的不确定性数据清理方法 [J].
覃远翔 ;
段亮 ;
岳昆 .
计算机应用, 2013, 33 (09) :2490-2492+2504
[2]   不确定性数据管理技术研究综述 [J].
周傲英 ;
金澈清 ;
王国仁 ;
李建中 .
计算机学报, 2009, 32 (01) :1-16
[3]  
Data Fusion for Traffic Incident Detector Using D-S Evidence Theory with Probabilistic SVMs [J] . Dehuai Zeng,Jianmin Xu,Gang Xu.&nbsp&nbspJournal of Computers . 2008 (10)
[4]  
Arktos : towards the modeling, design, control and execution of ETL processes [J] . Panos Vassiliadis,Zografoula Vagena,Spiros Skiadopoulos,Nikos Karayannidis,Timos Sellis.&nbsp&nbspInformation Systems . 2001 (8)
[5]  
Clean answers over dirty databases:a probabilistic approach .2 Andritsos P,Fuxman A,Miller R J. Proceedings of the22nd International Conference on Data Engineering,(ICDE2006) . 2006