一种支持数据质量评价的方法与应用研究

被引:21
作者
宋俊典
刘丰源
机构
[1] 上海计算机软件技术开发中心
关键词
数据质量评估; 多维度; 质量指标体系; 模糊综合评价法;
D O I
暂无
中图分类号
F49 [信息产业经济]; O159 [模糊数学];
学科分类号
020205 [产业经济学]; 070101 [基础数学];
摘要
为提升数据质量,实现数据有重点的清洁,通过提出一种面向多维度数据质量的模糊综合评价方法,可有效辅助企业明确数据质量的等级分布,有助于企业对数据质量的改进。通过文献调研,基于现有数据质量评价指标体系研究成果构建适合的数据质量指标体系,确定评价指标集并建立四级评语集。采用德尔菲法和层次分析法确定权重集,确定隶属度函数和特征向量,并进行模糊转换和模糊计算,最终根据最大隶属度原则得到质量评级。以某项目中真实数据为例进行实例验证,基于本方法实现的系统得到的数据质量评价结果与市面上某主流数据质量管理软件评估结果一致性达90%以上,验证了本方法可以为数据质量的评估提供更为全面的评价维度,并保证一定的准确性和可靠性。
引用
收藏
页码:328 / 333
页数:6
相关论文
共 13 条
[1]
修正Benford分布律及其在数据准确性评估中的应用 [D]. 
王欣 .
天津财经大学,
2016
[2]
AIMQ: a methodology for information quality assessment [J].
Lee, YW ;
Strong, DM ;
Kahn, BK ;
Wang, RY .
INFORMATION & MANAGEMENT, 2002, 40 (02) :133-146
[3]
Information quality benchmarks.[J].Beverly K. Kahn;Diane M. Strong;Richard Y. Wang.Communications of the ACM.2002, 4
[4]
Data quality assessment.[J].Leo L. Pipino;Yang W. Lee;Richard Y. Wang.Communications of the ACM.2002, 4
[5]
A product perspective on total data quality management [J].
Wang, RY .
COMMUNICATIONS OF THE ACM, 1998, 41 (02) :58-65
[6]
基于匹配性的GDP数据质量评估研究 [D]. 
李庭辉 .
湖南大学,
2012
[7]
大数据环境下Web数据源质量评估方法研究 [J].
赵星 ;
李石君 ;
余伟 ;
杨莎 ;
丁永刚 ;
胡亚慧 .
计算机工程, 2017, 43 (02) :48-56
[8]
数据质量多种性质的关联关系研究 [J].
丁小欧 ;
王宏志 ;
张笑影 ;
李建中 ;
高宏 .
软件学报, 2016, 27 (07) :1626-1644
[9]
病案首页数据质量的量化评估方法研究及应用 [J].
吴骋 ;
秦婴逸 ;
肖翔 ;
周云 ;
贺佳 .
中国病案, 2016, 17 (03) :10-13
[10]
基于综合隶属度函数的模糊支持向量回归机 [J].
王珏 ;
乔建忠 ;
林树宽 ;
罗海艳 .
小型微型计算机系统, 2016, 37 (03) :551-554