并行挖掘频繁项目集新算法——MREclat

被引:10
作者
章志刚
吉根林
唐梦梦
机构
[1] 南京师范大学计算机科学与技术学院
关键词
频繁项目集; 并行挖掘算法; 列存储; Map/Reduce; Eclat算法;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
摘要
针对Eclat算法在挖掘海量数据中的频繁项目集时存在的内存和计算资源不足等问题,提出了基于Map/Reduce计算模型的并行挖掘算法——MREclat。首先,将水平型数据库转换成垂直型数据库;然后,将转换后的数据按2-项集的前缀分发到各个计算节点上,且在分发数据时引入了均衡策略;接着,在各个计算节点上求出以某一前缀开头的所有频繁项目集;最后,合并各个节点的结果得到所有频繁项目集。介绍了MREclat的设计思想,研究了算法的运行性能。实验结果表明,MREclat算法效率大约是PEclat算法的2倍,加速比性能比PEclat算法提高了64%。
引用
收藏
页码:2175 / 2178
页数:4
相关论文
共 1 条
[1]
基于MapReduce的海量数据挖掘技术研究 [J].
李伟卫 ;
赵航 ;
张阳 ;
王勇 .
计算机工程与应用, 2013, 49 (20) :112-117