一种基于FP-Growth的频繁项目集并行挖掘算法

被引:44
作者
章志刚
吉根林
机构
[1] 南京师范大学计算机科学与技术学院
关键词
频繁项目集; 并行挖掘; FP-Growth; Map/Reduce;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
FP-Growth算法是基于FP树挖掘频繁项目集的经典算法,为提高FP-Growth算法挖掘大规模数据频繁项目集的效率,提出了一种基于FP-Growth的频繁项目集并行挖掘算法FPPM。该算法基于Map/Reduce并行模型,在每个计算节点上首先构造局部频繁模式树,并对之进行挖掘得到局部频繁项目集,然后合并局部频繁项目集以得到全局频繁项集,由于此时得到的结果并不完备,所以对合并后未达到最小支持度阈值的项目集,重新计算其支持数。介绍了FPPM算法的设计思想,测试了其性能。实验结果表明FPPM算法具有较好的可扩展性。
引用
收藏
页码:103 / 106
页数:4
相关论文
共 2 条
[1]   一种基于云计算的关联规则Apriori算法 [J].
张圣 .
通信技术, 2011, 44 (06) :141-143
[2]   云计算环境下关联规则挖掘算法的研究 [J].
李玲娟 ;
张敏 .
计算机技术与发展, 2011, 21 (02) :43-46+50