大数据环境下关联规则并行分层挖掘算法研究

被引:42
作者
张忠林
田苗凤
刘宗成
机构
[1] 兰州交通大学电子与信息工程学院
关键词
大数据; 划分; 关联规则; 并行分层挖掘; 高效性;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
摘要
为满足大数据实时处理的需求,提出了一种基于划分的关联规则并行分层挖掘算法(Parallel Hierarchical Association Rule Mining,PHARM)。首先,将整个数据库D随机分割成若干个非重叠区域,并行挖掘出局部频繁项集;然后利用先验性质,连接局部频繁项集得全局候选项集;再次扫描D统计出每个候选项集的实际支持度,以确定全局频繁项集。最后,建模分析了该算法的高效性。
引用
收藏
页码:286 / 289
页数:4
相关论文
共 11 条
[1]
基于Hadoop的并行关联规则算法研究 [D]. 
余楚礼 .
天津理工大学,
2011
[2]
大数据分析中的关联挖掘 [J].
金宗泽 ;
冯亚丽 ;
纪博 ;
张希 ;
高快 .
计算机与数字工程, 2014, 42 (10) :1924-1928
[3]
基于GPU的并行化Apriori算法的设计与实现 [J].
唐家维 ;
王晓峰 .
计算机科学, 2014, 41 (10) :238-243
[4]
An Efficient Multidimensional Fusion Algorithm for IoT Data Based on Partitioning.[J].Jin Zhou;Liang Hu;Feng Wang;Huimin Lu;Kuo Zhao;.Tsinghua Science and Technology.2013, 04
[5]
大数据管理:概念、技术与挑战 [J].
孟小峰 ;
慈祥 .
计算机研究与发展, 2013, (01) :146-169
[6]
一种高效的多层和概化关联规则挖掘方法 [J].
毛宇星 ;
陈彤兵 ;
施伯乐 .
软件学报, 2011, 22 (12) :2965-2980
[7]
云计算环境下基于改进遗传算法的任务调度算法 [J].
李建锋 ;
彭舰 .
计算机应用, 2011, 31 (01) :184-186
[8]
数据挖掘.[M].(加)JiaweiHan;(加)MichelineKamber著;范明;孟小峰等译;.机械工业出版社.2001,
[9]
Mining big data.[J].Wei Fan;Albert Bifet.ACM SIGKDD Explorations Newsletter.2013, 2
[10]
The Pathologies of Big Data [J].
Jacobs, Adam .
COMMUNICATIONS OF THE ACM, 2009, 52 (08) :36-44