共 2 条
一种基于FP-Growth的频繁项目集并行挖掘算法
被引:44
作者:
章志刚
吉根林
机构:
[1] 南京师范大学计算机科学与技术学院
来源:
关键词:
频繁项目集;
并行挖掘;
FP-Growth;
Map/Reduce;
D O I:
暂无
中图分类号:
TP311.13 [];
学科分类号:
1201 ;
摘要:
FP-Growth算法是基于FP树挖掘频繁项目集的经典算法,为提高FP-Growth算法挖掘大规模数据频繁项目集的效率,提出了一种基于FP-Growth的频繁项目集并行挖掘算法FPPM。该算法基于Map/Reduce并行模型,在每个计算节点上首先构造局部频繁模式树,并对之进行挖掘得到局部频繁项目集,然后合并局部频繁项目集以得到全局频繁项集,由于此时得到的结果并不完备,所以对合并后未达到最小支持度阈值的项目集,重新计算其支持数。介绍了FPPM算法的设计思想,测试了其性能。实验结果表明FPPM算法具有较好的可扩展性。
引用
收藏
页码:103 / 106
页数:4
相关论文