分布式数据质量管理系统在电力企业的实践和应用

被引:8
作者
李远宁
刘森
张诗军
陈丰
王志英
机构
[1] 中国南方电网有限责任公司信息部
关键词
数据质量管理; 分布式; Hadoop;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
随着企业信息化水平和企业精细化管理要求的不断提高,企业对数据管理的需求也随之增强,如何提高企业数据质量更是需要重点解决的问题。针对电力企业数据质量管理面临的挑战,创新提出了分布式数据质量管理解决方案。针对集中式数据质量系统的性能瓶颈,在研究数据质量系统特点并借鉴国内外对大数据的解决方案后,提出了基于Hadoop分布式处理框架的解决方案。利用Hadoop集群,可以把缺陷数据从Oracle中抽离,分散存储在集群里多台服务器上,以有效提高磁盘I/O性能和数据分析性能。
引用
收藏
页码:169 / 174
页数:6
相关论文
共 5 条
[1]   基于Hadoop架构的分布式计算和存储技术及其应用 [J].
田秀霞 ;
周耀君 ;
毕忠勤 ;
彭源 .
上海电力学院学报, 2011, 27 (01) :70-74
[2]   虚拟化的集群资源管理技术研究 [J].
辛军 ;
陈康 ;
郑纬民 .
计算机科学与探索, 2010, (04) :324-329
[3]   基于元数据扩展的空间数据质量管理方法 [J].
胡金林 ;
梅士员 .
现代测绘, 2004, (03) :21-24
[4]   信息系统中的数据质量问题研究 [J].
陈远 ;
罗琳 ;
沈祥兴 .
中国图书馆学报, 2004, (01) :50-52
[5]  
云计算.[M].刘鹏; 主编.电子工业出版社.2010,