基于Hadoop和Hive的电信行业数据仓库研究

被引:20
作者
王苏卫
机构
[1] 长沙航空职业技术学院
关键词
Hadoop; Hive; 数据仓库; 海量数据;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
摘要
分析处理海量数据成为各电信运营商急需解决的问题。本文描述的基于Hadoop和Hive的数据仓库能很好的解决这个问题,Hadoop依靠普通的PC集群提供可靠的并行计算服务和存储平台,Hive基于M/R框架,提供类SQL功能的HQL语言,为用户提供了一个高效、海量和便捷的数据仓库平台。通过对电信行业海量话单的分析证明,此数据仓库解决方案在处理海量数据上,具有关系型数据仓库不能比拟的性能。摘要分析处理海量数据成为各电信运营商急需解决的问题。本文描述的基于Hadoop和Hive的数据仓库能很好的解决这个问题,Hadoop依靠普通的PC集群提供可靠的并行计算服务和存储平台,Hive基于M/R框架,提供类SQL功能的HQL语言,为用户提供了一个高效、海量和便捷的数据仓库平台。通过对电信行业海量话单的分析证明,此数据仓库解决方案在处理海量数据上,具有关系型数据仓库不能比拟的性能。
引用
收藏
页数:1
相关论文
共 4 条
[1]
基于Hadoop及关系型数据库的海量数据分析研究 [J].
程莹 ;
张云勇 ;
徐雷 ;
房秉毅 .
电信科学, 2010, 26 (11) :47-50
[2]
Hadoop平台的性能优化研究 [J].
栾亚建 ;
黄翀民 ;
龚高晟 ;
赵铁柱 .
计算机工程, 2010, 36 (14) :262-263+266
[3]
云计算在电信行业的应用研究 [J].
潘文宇 ;
段勇 .
电信科学, 2010, 26 (06) :25-29
[4]
基于Hadoop MapReduce模型的应用研究 [J].
谢桂兰 ;
罗省贤 .
微型机与应用, 2010, 29 (08) :4-7