基于MapReduce的频繁项集挖掘方法

被引:25
作者
戎翔
李玲娟
机构
[1] 南京邮电大学计算机学院
关键词
云计算; Hadoop; Apriori; MapReduce;
D O I
10.13682/j.issn.2095-6533.2011.04.032
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
为了改进关联规则挖掘的经典Apriori算法,设计一种基于Map/Reduce的频繁项集挖掘方法。通过搭建Hadoop平台,可使该方法得以实现,并籍此对该方法与Apriori算法的性能进行比较研究。实验结果表明该方法在对大数据集进行频繁项集挖掘时,可充分利用云计算的优势,从而能获得更好的时效性。
引用
收藏
页码:37 / 39+43 +43
页数:4
相关论文
共 5 条
[1]   云计算下的海量数据挖掘研究 [J].
王鄂 ;
李铭 .
现代计算机(专业版), 2009, (11) :22-25+50
[2]  
基于Hadoop的海量数据处理模型研究和应用[D]. 朱珠.北京邮电大学 2008
[3]  
数据挖掘中关联规则的研究及应用[D]. 高伟峰.武汉理工大学 2006
[4]  
Standardizing the Cloud for Inter-operability. Mark A Carlson. Storage Developer Conference2009 . 2009
[5]  
Infrastructuresfor Collaborative Enterprises. Dr.Rao Mikkilineni,Vijay Sarathy. 18thIEEEInterna-tional Workshops on Enabling Technologies . 2009