云环境下关联规则算法的研究

被引:16
作者
周丽娟
王翔
机构
[1] 首都师范大学信息工程学院
关键词
云计算; 关联规则; FP-Growth; 数据挖掘; 大数据;
D O I
10.16208/j.issn1000-7024.2014.02.045
中图分类号
TP311.13 [];
学科分类号
摘要
为了解决传统数据挖掘算法在处理海量数据时候的性能瓶颈问题,对FP-Growth算法进行了研究。提出了一种云计算环境下的基于复合链表挖掘的并行FP-Growth算法(PCL-FP)。该算法不构建FP-Tree以及条件FP-Tree,而是利用复合链表来挖掘频繁模式。通过使用不同大小的数据集对改进后的算法进行验证,验证结果表明,提出的PCL-FP算法有效提高了效率,具有很好的灵活性和扩展性,可以广泛的应用到海量数据处理,挖掘频繁项目集。
引用
收藏
页码:499 / 503
页数:5
相关论文
共 8 条
[1]
一种基于聚合链的改进FP-Growth算法 [J].
焦明海 ;
姜慧研 ;
唐加福 .
东北大学学报, 2006, (02) :153-156
[2]
Hadoop权威指南.[M].(美) 怀特 (White;T.) ; 著.清华大学出版社.2010,
[3]
数据挖掘原理与算法.[M].毛国君等; 编著.清华大学出版社.2007,
[4]
Performance comparison under failures of MPI and MapReduce: An analytical approach [J].
Jin, Hui ;
Sun, Xian-He .
FUTURE GENERATION COMPUTER SYSTEMS-THE INTERNATIONAL JOURNAL OF ESCIENCE, 2013, 29 (07) :1808-1815
[5]
Analytical Performance Models for MapReduce Workloads [J].
Vianna, Emanuel ;
Comarela, Giovanni ;
Pontes, Tatiana ;
Almeida, Jussara ;
Almeida, Virgilio ;
Wilkinson, Kevin ;
Kuno, Harumi ;
Dayal, Umeshwar .
INTERNATIONAL JOURNAL OF PARALLEL PROGRAMMING, 2013, 41 (04) :495-525
[6]
Anomaly Extraction in Backbone Networks Using Association Rules [J].
Brauckhoff, Daniela ;
Dimitropoulos, Xenofontas ;
Wagner, Arno ;
Salamatian, Kave .
IEEE-ACM TRANSACTIONS ON NETWORKING, 2012, 20 (06) :1788-1799
[7]
Batch incremental processing for FP-tree construction using FP-Growth algorithm [J].
Totad, Shashikumar G. ;
Geeta, R. B. ;
Reddy, P. V. G. D. Prasad .
KNOWLEDGE AND INFORMATION SYSTEMS, 2012, 33 (02) :475-490
[8]
MapReduce.[J].Jeffrey Dean;Sanjay Ghemawat.Communications of the ACM.2008, 1