基于迭代式MapReduce的Apriori算法设计与实现

被引:9
作者
章志刚 [1 ]
吉根林 [1 ]
机构
[1] 南京师范大学计算机科学与技术学院
关键词
云计算; 数据挖掘; 关联规则; 迭代式MapReduce; Apriori;
D O I
10.13245/j.hust.2012.s1.058
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
为提高Apriori算法挖掘频繁项目集的效率,基于迭代式MapReduce模型对Apriori算法进行并行化,设计出了能够在云计算环境下进行频繁项目集挖掘的新算法.与传统的Apriori并行算法相比,新算法利用事务约减规则进行改进,减少了每次扫描时所需扫描事务的个数,能够显著减少运行时间.介绍了新算法的设计思想,研究了算法的性能.实验结果表明所提算法比已有方法具有更高的运行效率及较好的可扩展性.
引用
收藏
页码:9 / 12
页数:4
相关论文
共 2 条
[1]   一种基于云计算的关联规则Apriori算法 [J].
张圣 .
通信技术, 2011, 44 (06) :141-143
[2]   云计算环境下关联规则挖掘算法的研究 [J].
李玲娟 ;
张敏 .
计算机技术与发展, 2011, 21 (02) :43-46+50