基于Hadoop的Apriori算法与实现

被引:20
作者
孙赵旭 [1 ]
谢晓兰 [1 ,2 ]
周国清 [2 ]
倪金生 [2 ]
胡莘 [2 ]
机构
[1] 桂林理工大学信息科学与工程学院
[2] 桂林理工大学广西空间信息与测绘重点实验室
关键词
数据挖掘; 云计算; Hadoop; Hbase; MapReduce; Apriori;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
摘要
针对传统Aprion数据挖掘算法平台的硬件瓶颈以及算法运算耗时、需要重复扫描数据库等缺点,提出了一种基于Hadoop平台应用MapReduce模型与Hbase,对Apriori进行云端的迁移和优化的算法,并与其他的改进Apriori算法进行了分析与比较。实验结果表明:新的云端算法降低了时间复杂度,使其可以更好的进行数据处理。
引用
收藏
页码:584 / 588
页数:5
相关论文
共 8 条
[1]
HBase大对象存储方案的设计与实现 [D]. 
康毅 .
南京大学,
2013
[2]
基于HBase的海量数据实时查询系统设计与实现 [D]. 
卓海艺 .
北京邮电大学,
2013
[3]
应用Apriori关联规则算法的数据挖掘技术挖掘电子商务潜在客户 [D]. 
乌文波 .
浙江工业大学,
2012
[4]
基于HBASE的列存储压缩算法的研究与实现 [D]. 
罗燕新 .
华南理工大学,
2011
[5]
‘Big data’; Hadoop and cloud computing in genomics.[J].Aisling O’Driscoll;Jurate Daugelaite;Roy D. Sleator.Journal of Biomedical Informatics.2013,
[6]
大数据处理技术与探索 [J].
肖飞 ;
齐立磊 .
计算机与现代化 , 2013, (09) :75-77
[7]
基于HADOOP平台的云GIS构架研究 [J].
郝伟姣 ;
周世健 ;
彭大为 .
江西科学, 2013, 31 (01) :109-112
[8]
一种新的频繁项集挖掘算法 [J].
刘德喜 ;
何炎祥 ;
邢显黎 .
计算机应用研究, 2007, (02) :17-19+62