基于Spark的OS-ELM并行化算法

被引：5

作者：

邓万宇

杨丽霞

机构：

[1] 西安邮电大学计算机学院

来源：

西安邮电大学学报 | 2016年 / 21卷 / 02期

关键词：

在线连续极限学习机; 大数据; Spark; 并行计算;

D O I：

10.13682/j.issn.2095-6533.2016.02.020

中图分类号：

TP338.6 [并行计算机];

学科分类号：

140102 [集成电路设计与设计自动化];

摘要：

针对Spark平台的弹性分布式数据集并行计算框架机制,提出一种在线连续极限学习机并行处理的改进算法。利用分离在线连续极限学习机矩阵之间的依赖关系,将大规模数据中的高度复杂的矩阵分布到Spark集群中并行化计算,并行计算多个增量数据块的隐藏层输出矩阵,实现OS-ELM对矩阵的加速求解。实验结果表明,该算法在保持精度的同时可有效缩短学习时间,改善了大数据的扩展能力。

引用

页码：101 / 104+118 +118

页数：5

共 8 条

[1]

基于分布式平台Spark和YARN的数据挖掘算法的并行化研究 [D].