共 14 条
基于MPP-Hadoop混合架构高校数据集成系统研究
被引:9
作者:
邓涵元
[1
,2
]
卢山
[2
]
程光
[3
]
机构:
[1] 武汉邮电科学研究院
[2] 南京烽火软件科技有限公司
[3] 东南大学
来源:
关键词:
数据集成;
高校大数据;
MPP;
Hadoop;
GreenPlum;
D O I:
暂无
中图分类号:
G647 [学校管理];
TP311.13 [];
学科分类号:
1201 ;
摘要:
随着数字化校园的建设,传统的数据集成系统在海量数据环境下数据查询和加载的效率均有所下降,且难以对非结构化、半结构化数据进行融合和分析。针对以上情况,依托高校大数据平台,从各个异构系统中抽取出数据,结合Hadoop和MPP技术的优势,设计并实现了一个基于MPP-Hadoop混合框架的高校异构数据集成系统,融合多种不同结构数据,提升了数据查询和加载的效率。以某高校为例,从学生的门禁刷卡系统和校园网系统中抽取出学生的行为轨迹数据,载入MPP数据仓库,进行数据融合,并与传统数据仓库产品Oracle搭建的现有高校数据集成系统进行数据加载和数据查询效率方面的对比评测,验证了系统的有效性并且为学生的学习生活、心理等各方面的管理工作提供一定的技术支持和指导。
引用
收藏
页码:160 / 163+169
+169
页数:5
相关论文