共 7 条
FP-Growth算法MapReduce化研究
被引:18
作者:
吕雪骥
李龙澍
机构:
[1] 安徽大学计算机科学与技术学院
来源:
基金:
安徽省自然科学基金;
关键词:
MapReduce;
FP-Growth;
MR-FP;
云计算;
分布式数据挖掘;
D O I:
暂无
中图分类号:
TP311.13 [];
学科分类号:
1201 ;
摘要:
随着云计算概念的盛行,以及数据挖掘技术在分布式环境下的应用问题,该文献针对当前业界中流行的大规模并行计算模型MapReduce,将其引入数据挖掘领域关联规则算法的并行化改进中,提出基于FP-Growth算法并行化改进的MR-FP算法,为并行化关联规则挖掘提供节点可扩展、可容错、故障可恢复的运行保证。并通过案例分析得出系统在事务数呈数量级级别增长下仍可保持较高的性能。通过理论分析和案例实验表明,数据挖掘理论和方法在云计算环境下可以充分发挥能力,具有广阔的、有价值的研究空间。
引用
收藏
页码:123 / 126+130
+130
页数:5
相关论文