一种基于后缀项表的并行闭频繁项集挖掘算法

被引:14
作者
唐颖峰 [1 ,2 ]
陈世平 [1 ]
机构
[1] 上海理工大学管理学院
[2] 上海对外经贸大学教务处
关键词
频繁项集挖掘; 并行挖掘算法; MapReduce; 闭频繁项集; 后缀项表;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
摘要
对现有的基于MapReduce的并行频繁项集挖掘算法进行了研究,提出一种基于后缀项表的并行闭频繁项集挖掘算法,通过后缀项表的引入及以闭频繁项集挖掘的形式,减少组分间的数据传送量,提高挖掘效率。实验表明,该算法可以有效缩短平均挖掘时间,对于高维大数据具有较好的性能。
引用
收藏
页码:373 / 377
页数:5
相关论文
共 4 条
[1]
MapReduce.[J].Jeffrey Dean;Sanjay Ghemawat.Communications of the ACM.2008, 1
[2]
Frequent pattern mining: current status and future directions [J].
Han, Jiawei ;
Cheng, Hong ;
Xin, Dong ;
Yan, Xifeng .
DATA MINING AND KNOWLEDGE DISCOVERY, 2007, 15 (01) :55-86
[3]
Mining frequent patterns without candidate generation [J].
Han, JW ;
Pei, J ;
Yin, YW .
SIGMOD RECORD, 2000, 29 (02) :1-12
[4]
Mining association rules between sets of items in large databases.[J].Rakesh Agrawal;Tomasz Imieliński;Arun Swami.ACM SIGMOD Record.1993, 2