基于分布式数据挖掘方法的研究与应用

被引:7
作者
汪丽 [1 ]
张露 [2 ]
机构
[1] 武汉理工大学统战部
[2] 武汉理工大学计算机科学与技术学院
关键词
分布式数据挖掘; MapReduce模型; 关联规则; 分布式教育决策支持系统;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
针对关联规则Apriori算法多次重复扫描数据库和产生大量候选频繁项集的缺点,对其进行改进,并在MapReduce模型上得以实现。改进的Apriori算法只需要对整个数据库扫描一次,即可得到所有频繁项集的集合。仿真实验结果表明,随着节点数目的增多,改进算法比原算法执行时间要短,并且这种优势随着节点数目的增加而扩大,说明在异构集群环境下,MapReduce模型的Apriori算法能够提高关联规则挖掘的执行效率。将改进的分布式关联规则算法在分布式教育决策支持系统中应用,通过对实际数据的挖掘,证明了该方法对教育决策的有效性。
引用
收藏
页码:40 / 43
页数:4
相关论文
共 3 条
[1]   基于数组的Apriori算法的改进 [J].
钱少华 ;
蔡勇 ;
钱雪忠 .
计算机应用与软件, 2006, (02) :111-113
[2]  
我国专业学位研究生培养模式的系统结构研究[D]. 廖文婕.华南理工大学. 2010
[3]  
数据挖掘[M]. 清华大学出版社 , (美)MehmedKantardzic著, 2003