基于Spark的OS-ELM并行化算法

被引:5
作者
邓万宇
杨丽霞
机构
[1] 西安邮电大学计算机学院
关键词
在线连续极限学习机; 大数据; Spark; 并行计算;
D O I
10.13682/j.issn.2095-6533.2016.02.020
中图分类号
TP338.6 [并行计算机];
学科分类号
140102 [集成电路设计与设计自动化];
摘要
针对Spark平台的弹性分布式数据集并行计算框架机制,提出一种在线连续极限学习机并行处理的改进算法。利用分离在线连续极限学习机矩阵之间的依赖关系,将大规模数据中的高度复杂的矩阵分布到Spark集群中并行化计算,并行计算多个增量数据块的隐藏层输出矩阵,实现OS-ELM对矩阵的加速求解。实验结果表明,该算法在保持精度的同时可有效缩短学习时间,改善了大数据的扩展能力。
引用
收藏
页码:101 / 104+118 +118
页数:5
相关论文
共 8 条
[1]
基于分布式平台Spark和YARN的数据挖掘算法的并行化研究 [D]. 
梁彦 .
中山大学,
2014
[2]
基于云平台的OLAP系统研究与实现 [D]. 
刘瑜 .
东北大学,
2013
[3]
Parallel online sequential extreme learning machine based on MapReduce.[J].Botao Wang;Shan Huang;Junhao Qiu;Yu Liu;Guoren Wang.Neurocomputing.2015,
[4]
Extreme learning machine: Theory and applications.[J].Guang-Bin Huang;Qin-Yu Zhu;Chee-Kheong Siew.Neurocomputing.2006, 1
[5]
大数据Spark企业级实战.[M].王家林.电子工业出版社.2015, 978-7-121-24744-6
[6]
一种改进的集成在线顺序极限学习机 [J].
付倩 ;
韩飞 ;
叶松林 .
无线通信技术, 2013, 22 (03) :39-44
[7]
在线序列ELM算法及其发展 [J].
杨乐 ;
张瑞 .
西北大学学报(自然科学版), 2012, 42 (06) :885-889+896
[8]
基于MapReduce的频繁项集挖掘方法 [J].
戎翔 ;
李玲娟 .
西安邮电学院学报, 2011, 16 (04) :37-39+43