大数据环境下基于Hadoop框架的数据挖掘算法的研究与实现

被引:16
作者
洪波
吕燕霞
黄磊
机构
[1] 武汉市劳动和社会保障信息中心
关键词
大数据; Hadoop; 关联规则; 数据挖掘;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
摘要
为了提高大数据环境下的数据挖掘速度,对分布式计算构架Hadoop进行分析与研究,提出一种基于Hadoop平台的大数据关联规则挖掘算法MRPre Post。该算法在Pre Post算法基础上改进而来,采用Hadoop平台降低分布式编程的难度且易于管理,通过一种自底向上的深度优化策略改进Pre Post算法,降低内存开销,同时采用负载均衡的分组策略,来提高并行算法的性能,最终试验表明,该算法运行速度快,适应大数据关联规则挖掘。
引用
收藏
页码:41 / 44
页数:4
相关论文
共 14 条
[1]
Hadoop大数据处理.[M].刘军; 编著.人民邮电出版社.2013,
[2]
基于HADOOP的数据挖掘算法并行化研究与实现.[D].吴泽伦.北京邮电大学.2014, 04
[3]
在云环境下的数据挖掘算法的并行化研究 [D]. 
胡善杰 .
电子科技大学,
2013
[4]
云数据中心计算资源监控系统的设计与实现 [D]. 
胡金安 .
电子科技大学,
2012
[5]
基于分布式计算平台的海量日志分析系统的设计与实现.[D].孙寅林.西安电子科技大学.2012,
[6]
基于Hadoop的数据挖掘算法研究与实现 [D]. 
白云龙 .
北京邮电大学,
2011
[7]
基于Map-Reduce的大数据缺失值填充算法 [J].
金连 ;
王宏志 ;
黄沈滨 ;
高宏 .
计算机研究与发展 , 2013, (S1) :312-321
[8]
关联规则挖掘的软集包含度方法 [J].
耿生玲 ;
李永明 ;
刘震 .
电子学报, 2013, 41 (04) :804-809
[9]
多时间序列关联规则分析的论坛舆情趋势预测 [J].
钱爱玲 ;
瞿彬彬 ;
卢炎生 ;
陈攀攀 ;
陈国栋 .
南京航空航天大学学报, 2012, 44 (06) :904-910
[10]
常用数据挖掘算法研究 [J].
王海涛 ;
陈树宁 .
电子设计工程, 2011, (11) :90-92