一种基于后缀项表的并行闭频繁项集挖掘算法

被引：14

作者：

唐颖峰 ^{[1
,2
]}

陈世平 ^{[1
]}

机构：

[1] 上海理工大学管理学院

[2] 上海对外经贸大学教务处

来源：

关键词：

频繁项集挖掘; 并行挖掘算法; MapReduce; 闭频繁项集; 后缀项表;

D O I：

暂无

中图分类号：

TP311.13 [];

学科分类号：

摘要：

对现有的基于MapReduce的并行频繁项集挖掘算法进行了研究,提出一种基于后缀项表的并行闭频繁项集挖掘算法,通过后缀项表的引入及以闭频繁项集挖掘的形式,减少组分间的数据传送量,提高挖掘效率。实验表明,该算法可以有效缩短平均挖掘时间,对于高维大数据具有较好的性能。

引用

页码：373 / 377

页数：5

共 4 条

[1]

MapReduce.[J].Jeffrey Dean;Sanjay Ghemawat.Communications of the ACM.2008, 1

[2]

Han, Jiawei ;

Cheng, Hong ;

Xin, Dong ;

Yan, Xifeng .

[3]

Han, JW ;

Pei, J ;

Yin, YW .

[4]

Mining association rules between sets of items in large databases.[J].Rakesh Agrawal;Tomasz Imieliński;Arun Swami.ACM SIGMOD Record.1993, 2