云计算环境下关联规则挖掘算法的研究

被引:50
作者
李玲娟
张敏
机构
[1] 南京邮电大学计算机学院
关键词
云计算; 数据挖掘; Apriori; MapReduce;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
云计算为存储和分析海量数据提供了廉价高效的解决方案,云计算环境下的数据挖掘算法的研究具有重要的理论意义和应用价值。针对云计算环境下的关联规则挖掘算法展开研究,介绍了云计算的概念、Hadoop框架平台、MapReduce编程模型和传统的Apriori算法;在此基础上,以实现云计算环境下的并行化数据挖掘为目的,对Apriori算法进行了改进,给出了改进的算法在Hadoop中的MapReduce编程模型上的执行流程;通过一个简单的频繁项集挖掘实例展示了改进的算法的执行效率及实用性。
引用
收藏
页码:43 / 46+50 +50
页数:5
相关论文
共 7 条
  • [1] 云计算下的海量数据挖掘研究
    王鄂
    李铭
    [J]. 现代计算机(专业版), 2009, (11) : 22 - 25+50
  • [2] 并行数据挖掘算法综述
    刘华元
    袁琴琴
    王保保
    [J]. 电子科技, 2006, (01) : 65 - 68+73
  • [3] 基于Hadoop的海量数据处理模型研究和应用[D]. 朱珠.北京邮电大学 2008
  • [4] 数据挖掘中关联规则的研究及应用[D]. 高伟峰.武汉理工大学 2006
  • [5] 数据挖掘原理与算法[M]. 中国水利水电出版社 , 邵峰晶,于忠清编著, 2003
  • [6] Computing in the clouds[J] . Aaron Weiss.netWorker . 2007 (4)
  • [7] Top 10 algorithms in data mining[J] . Xindong Wu,Vipin Kumar,J. Ross Quinlan,Joydeep Ghosh,Qiang Yang,Hiroshi Motoda,Geoffrey J. McLachlan,Angus Ng,Bing Liu,Philip S. Yu,Zhi-Hua Zhou,Michael Steinbach,David J. Hand,Dan Steinberg.Knowledge and Information Systems . 2009 (1)