卷积神经网络的并行化研究

被引：0

作者：

凡保磊

机构：

[1] 郑州大学

关键词：

卷积神经网络; 并行化; MapReduce框架; GPU加速;

D O I：

暂无

年度学位：

2013

学位类型：

硕士

导师：

范明;

摘要：

卷积神经网络(Convolutional Neural NetWorks, CNN);算法能够有效地从原始输入中学习到高阶不变性的特征,广泛应用于车牌检测、人脸检测、手势识别、语音识别、图像复原和语义分析等领域。目前,CNN算法主要以串行方式实现。串行实现的CNN算法存在两个主要缺陷：(1)不能发挥算法内在的并行性,导致训练过程需要较长时间；(2)伸缩性不强,使得不能高效地处理数据密集型问题。谷歌提出的并行编程框架MapReduce具有良好的扩展性和容错性,成为当前云计算平台并行处理大规模数据的主流技术。本文使用MapReduce并行化CNN,并采用GPU加速计算过程,以增强算法的并行性和伸缩性,取得的成果如下： 1.提出利用MapReduce并行化训练卷积神经网络的方法(CNN-MR),并部署到Hadoop云计算平台。CNN-MR采用数据并行的分解方法,将训练样本划分给平台中的每个计算节点。并使用批量更新的方式,在所有计算节点处理本地训练样本结束之后,节点之间做一次通信,得到可训练参数在整个训练集上的全局梯度改变量并更新网络,多次迭代,至网络收敛到设定阈值或最大迭代次数,算法结束。 2.提出利用GPU加速CNN-MR算法的方法(CNN-MR-G),并部署到G-Hadoop计算平台。将CNN每层的特征图、神经元或权值分别映射到GPU的线程块、线程,使得同层神经元可并行地计算输出结果、输出误差或权值的局部梯度改变量。在手体字数据集(MNIST)和自建车牌数据集上的实验表明,CNN-MR算法相对于串行算法具有较好的加速比和伸缩性,CNN-MR-G算法对CNN-MR算法有较好的加速效果。

引用

页数：49

共 13 条

[1]

基于CUDA技术的卷积神经网络识别算法 [J].

张佳康 ;

陈庆奎 .

计算机工程, 2010, 36 (15) :179-181

[2]

图形处理器在数据库技术中的应用 [J].

杨珂 ;

罗琼 ;

石教英 .

浙江大学学报(工学版), 2009, 43 (08) :1349-1360

[3]

GPU加速的神经网络BP算法 [J].

田绪红 ;

江敏杰 .

计算机应用研究, 2009, 26 (05) :1679-1681+1699

[4]

基于图形处理器的数据流快速聚类 [J].

曹锋 ;

周傲英 .

软件学报, 2007, (02) :291-302

[5]

一种并行BP神经网络的动态负载平衡方案 [J].

赵莉 ;

程荣 .

计算机技术与发展, 2006, (07) :67-69+72

[6]

基于机群的并行BP算法的设计与实现.[J].高曙.武汉理工大学学报(交通科学与工程版).2002, 05

[7]

Best Practices for Convolutional Neural Networks Applied to Visual Document Analysis..Patrice Y. Simard;Dave Steinkraus;John Platt;.International Conference on Document Analysis and Recognition (ICDAR).2003,

[8]

Flexible; High Performance Convolutional Neural Networks for Image Classification..Ciresan D.C;Meier U;Masci J; et al;.Proceedings of the 22nd International Joint Conference on Artificial Intelligence.2011,

[9]

Choosing Among Several Parallel Implementations of the Backpropagation Algorithm..Petrowski A;.IEEE International Conference on Neural Networks.1994,

[10]

Multi-column deep neural network for traffic sign classification.[J]..Neural Networks.2012,

← 1 2 →