基于垂直频繁模式树带有负载均衡的分布关联规则挖掘算法

被引:8
作者
冯勇
尹洁娜
徐红艳
机构
[1] 辽宁大学信息学院
关键词
关联规则挖掘; 分布式; 垂直频繁模式; 负载均衡; 序列化;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
大数据时代,开展面向海量、分布数据的知识发现研究成为学界和业界关注的热点,而负载均衡问题是开发分布式挖掘算法必须考虑的重要因素之一。为此,提出了一种基于垂直频繁模式树带有负载均衡的分布关联规则挖掘算法,算法采用垂直频繁模式树存储项及其关联而无需对局部挖掘结果进行合并,减少了通信量,简化了处理流程。同时所提出的算法采用混合体系结构即中心站点按照局部站点的处理能力分配任务,实现了负载均衡,提升了算法的性能。实验结果表明所提算法切实可行并具有较高效率。
引用
收藏
页码:396 / 400
页数:5
相关论文
共 11 条
[1]  
分布式关联规则挖掘算法研究[D]. 郭俊凤.哈尔滨工程大学 2008
[2]  
A fast distributed algorithm for mining association rules. Cheung DW, Han Jiawei, et al. Proceedings of IEEE 4th International Conference Parallel and Distributed Information Systems . 1996
[3]  
分布式关联规则挖掘若干算法研究与实现[D]. 倪栋君.浙江工商大学 2009
[4]  
Mining association rules between sets of items in arge databases. R. Agrawal, T. Imielinski, and A. Swami. Proceedings of the ACM SIGMOD Conference on Management of Data . 1993
[5]  
HPFP-Miner:A Novel ParallelFrequent Itemset Mining Algorithm. CHEN Xiaoyun,HE Yanshan,CHEN Pengfei,MIAO Sheng-fa,SONG Weiguo,YUE Min. Fifth InternationalConference on Natural Computation . 2009
[6]   Toward boosting distributed association rule mining by data de-clustering [J].
Tseng, Frank S. C. ;
Kuo, Yen-Hung ;
Huang, Yueh-Min .
INFORMATION SCIENCES, 2010, 180 (22) :4263-4289
[7]  
Mining Frequent Patterns without Candidate Generation. Han J, Pei J, Yin Y. Proceedings of the 2000 ACM-SIGMOD International Conference on Management of Data . 2000
[8]   基于垂直FP树的并行频繁项集挖掘 [J].
徐杰 ;
李云 ;
刘博 ;
张晓斌 .
计算机与数字工程, 2012, 40 (10) :12-15
[9]   一种分布式数据库关联规则挖掘算法 [J].
曹文梁 .
计算机系统应用, 2012, 21 (08) :218-221
[10]   基于频繁模式树的分布式关联规则挖掘算法 [J].
何波 .
控制与决策, 2012, 27 (04) :618-622