大数据及海量数据处理架构:Hadoop vs MPP

被引:6
作者
巫东来 [1 ]
汤仕磊 [2 ]
机构
[1] 国电南瑞科技股份有限公司技术发展中心
[2] 南京上古网络科技有限公司
关键词
大数据; 海量数据存储; Hadoop; MPP; 分布式计算;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
开发海量数据处理系统时存在技术框架选择不确定问题。从理论及应用角度对两种主流的海量数据处理架构MPP和Hadoop进行对比,分析各自技术特点,阐述其与传统数据处理的优势。分析结果表明,Hadoop在存储数据规模上可轻松支持PB级别,而MPP架构大多只支持TB级别;Hadoop对海量半结构化、非结构化数据存储和处理有一定优势,但在处理速度和易用性上不及MPP;在结构化数据处理、响应性能和衍生工具等方面MPP则占优,适用于查询业务场景较多项目。通过分析两大框架底层核心技术以及归纳优缺点,为企业相关应用的技术选型提供参考。
引用
收藏
页码:218 / 222
页数:5
相关论文
共 8 条
[1]   MPP数据库在中国移动大数据应用中的前景分析 [J].
田雯 ;
刘倩 ;
孙红恩 .
电信工程技术与标准化, 2017, 30 (03) :87-91
[2]   基于Hadoop生态系统的大数据解决方案综述 [J].
陈吉荣 ;
乐嘉锦 .
计算机工程与科学, 2013, 35 (10) :25-35
[3]   大数据处理平台比较研究 [J].
许吴环 ;
顾潇华 .
软件导刊, 2017, 16 (04) :212-214
[4]   Hadoop HDFS和MapReduce架构浅析 [J].
郝树魁 .
邮电设计技术, 2012, (07) :37-42
[6]   公安云混搭架构下的数据安全增强技术研究 [J].
刘冰 .
警察技术, 2019, (02) :33-36
[7]   一种基于Hadoop平台的分布式数据检索系统 [J].
曹恒瑞 ;
曹展硕 .
软件导刊, 2017, 16 (04) :118-120
[8]   基于MPP-Hadoop混合架构高校数据集成系统研究 [J].
邓涵元 ;
卢山 ;
程光 .
计算机技术与发展, 2018, 28 (08) :160-163+169