电信企业数据仓库数据质量的研究与应用

被引:0
作者
方智
机构
[1] 国防科学技术大学
关键词
数据仓库; 数据质量; 数据质量检测; 数据质量评估模型;
D O I
暂无
年度学位
2006
学位类型
硕士
导师
摘要
随着数据仓库研究和应用的日益广泛和深入,数据质量问题逐渐成为数据仓库实施过程中最重要的问题之一。数据质量的好坏直接决定着数据仓库的应用质量和项目建设的成败。作为提高数据质量的必要基础和前提,数据质量检测与评估日益成为数据质量领域一个重要的研究内容,得到越来越多研究者的关注。本文针对电信企业数据仓库中数据质量检测与评估相关关键技术进行了有益的探索和研究,主要研究内容及成果包括: 1)基于数据仓库本身的特点,提出了一个基于角色的数据仓库数据质量评估模型,阐述了该模型的构造技术和计算方法。 2)研究分析了当前的主要数据质量检查方法及其特点,通过数据质量应用框架综合运用各种数据质量检测方法,实现了对数据仓库数据采集、转换、存储、应用不同阶段的数据质量检测,并结合电信的实际业务特点,提出了一种基于聚类分析的异常数据检测方法; 3)在信息化实践的基础上,针对电信数据仓库中环境异构数据源多、数据量大等特点,设计实现了与数据仓库无缝集成的可扩充的数据质量检测和评估系统。
引用
收藏
页数:78
共 9 条
[1]
数据挖掘.[M].(加)JiaweiHan;(加)MichelineKamber著;范明;孟小峰等译;.机械工业出版社.2001,
[2]
Data quality in context [J].
Strong, DM ;
Lee, YW ;
Wang, RY .
COMMUNICATIONS OF THE ACM, 1997, 40 (05) :103-110
[3]
Anchoring data quality dimensions in ontological foundations [J].
Wand, Y ;
Wang, RY .
COMMUNICATIONS OF THE ACM, 1996, 39 (11) :86-95
[4]
Toward quality data: An attribute-based approach.[J].Richard Y. Wang;M.P. Reddy;Henry B. Kon.Decision Support Systems.1995, 3
[5]
一种新的数据质量模型的研究 [J].
陈苏 ;
柏文阳 ;
徐洁磐 .
计算机应用研究, 2005, (07) :48-50
[6]
数据质量评估方法研究 [J].
杨青云 ;
赵培英 ;
杨冬青 ;
唐世渭 ;
童云海 ;
不详 .
计算机工程与应用 , 2004, (09) :3-4+15
[7]
数据仓库中数据质量控制研究 [J].
方幼林 ;
杨冬青 ;
唐世渭 ;
张卫华 ;
余利波 ;
付强 .
计算机工程与应用, 2003, (13) :1-4
[8]
异常检测算法分析 [J].
李炎 ;
李皓 ;
钱肖鲁 ;
朱扬勇 .
计算机工程, 2002, (06) :5-6+32
[9]
数据仓库数据质量评价研究及其应用 [D]. 
孟巍 .
河北工业大学,
2004