FP-Growth算法MapReduce化研究

被引:18
作者
吕雪骥
李龙澍
机构
[1] 安徽大学计算机科学与技术学院
基金
安徽省自然科学基金;
关键词
MapReduce; FP-Growth; MR-FP; 云计算; 分布式数据挖掘;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
随着云计算概念的盛行,以及数据挖掘技术在分布式环境下的应用问题,该文献针对当前业界中流行的大规模并行计算模型MapReduce,将其引入数据挖掘领域关联规则算法的并行化改进中,提出基于FP-Growth算法并行化改进的MR-FP算法,为并行化关联规则挖掘提供节点可扩展、可容错、故障可恢复的运行保证。并通过案例分析得出系统在事务数呈数量级级别增长下仍可保持较高的性能。通过理论分析和案例实验表明,数据挖掘理论和方法在云计算环境下可以充分发挥能力,具有广阔的、有价值的研究空间。
引用
收藏
页码:123 / 126+130 +130
页数:5
相关论文
共 7 条
[1]   基于MapReduce的频繁项集挖掘方法 [J].
戎翔 ;
李玲娟 .
西安邮电学院学报, 2011, 16 (04) :37-39+43
[2]   MapReduce并行编程架构模型研究 [J].
江务学 ;
张璟 ;
王志明 .
微电子学与计算机, 2011, 28 (06) :168-170+175
[3]   一种基于Hadoop的并行关联规则算法 [J].
余楚礼 ;
肖迎元 ;
尹波 .
天津理工大学学报, 2011, 27 (01) :25-28+32
[4]   基于Hadoop MapReduce模型的应用研究 [J].
谢桂兰 ;
罗省贤 .
微型机与应用, 2010, 29 (08) :4-7
[5]   负载均衡的FP-growth并行算法研究 [J].
曾志勇 ;
杨呈智 ;
陶冶 .
计算机工程与应用 , 2010, (04) :125-126+229
[6]   Web Service架构下的分布式关联规则挖掘研究 [J].
剧立伟 ;
姜浩 ;
蒲安建 .
计算机技术与发展, 2009, 19 (04) :31-34
[7]   基于Apriori & Fp-growth的频繁项集发现算法 [J].
何中胜 ;
庄燕滨 .
计算机技术与发展, 2008, (07) :45-47+52