卷积神经网络的并行化研究

被引:0
作者
凡保磊
机构
[1] 郑州大学
关键词
卷积神经网络; 并行化; MapReduce框架; GPU加速;
D O I
暂无
年度学位
2013
学位类型
硕士
导师
摘要
卷积神经网络(Convolutional Neural NetWorks, CNN);算法能够有效地从原始输入中学习到高阶不变性的特征,广泛应用于车牌检测、人脸检测、手势识别、语音识别、图像复原和语义分析等领域。目前,CNN算法主要以串行方式实现。串行实现的CNN算法存在两个主要缺陷:(1)不能发挥算法内在的并行性,导致训练过程需要较长时间;(2)伸缩性不强,使得不能高效地处理数据密集型问题。 谷歌提出的并行编程框架MapReduce具有良好的扩展性和容错性,成为当前云计算平台并行处理大规模数据的主流技术。本文使用MapReduce并行化CNN,并采用GPU加速计算过程,以增强算法的并行性和伸缩性,取得的成果如下: 1.提出利用MapReduce并行化训练卷积神经网络的方法(CNN-MR),并部署到Hadoop云计算平台。CNN-MR采用数据并行的分解方法,将训练样本划分给平台中的每个计算节点。并使用批量更新的方式,在所有计算节点处理本地训练样本结束之后,节点之间做一次通信,得到可训练参数在整个训练集上的全局梯度改变量并更新网络,多次迭代,至网络收敛到设定阈值或最大迭代次数,算法结束。 2.提出利用GPU加速CNN-MR算法的方法(CNN-MR-G),并部署到G-Hadoop计算平台。将CNN每层的特征图、神经元或权值分别映射到GPU的线程块、线程,使得同层神经元可并行地计算输出结果、输出误差或权值的局部梯度改变量。 在手体字数据集(MNIST)和自建车牌数据集上的实验表明,CNN-MR算法相对于串行算法具有较好的加速比和伸缩性,CNN-MR-G算法对CNN-MR算法有较好的加速效果。
引用
收藏
页数:49
共 13 条
[1]
基于CUDA技术的卷积神经网络识别算法 [J].
张佳康 ;
陈庆奎 .
计算机工程, 2010, 36 (15) :179-181
[2]
图形处理器在数据库技术中的应用 [J].
杨珂 ;
罗琼 ;
石教英 .
浙江大学学报(工学版), 2009, 43 (08) :1349-1360
[3]
GPU加速的神经网络BP算法 [J].
田绪红 ;
江敏杰 .
计算机应用研究, 2009, 26 (05) :1679-1681+1699
[4]
基于图形处理器的数据流快速聚类 [J].
曹锋 ;
周傲英 .
软件学报, 2007, (02) :291-302
[5]
一种并行BP神经网络的动态负载平衡方案 [J].
赵莉 ;
程荣 .
计算机技术与发展, 2006, (07) :67-69+72
[6]
基于机群的并行BP算法的设计与实现.[J].高曙.武汉理工大学学报(交通科学与工程版).2002, 05
[7]
Best Practices for Convolutional Neural Networks Applied to Visual Document Analysis..Patrice Y. Simard;Dave Steinkraus;John Platt;.International Conference on Document Analysis and Recognition (ICDAR).2003,
[8]
Flexible; High Performance Convolutional Neural Networks for Image Classification..Ciresan D.C;Meier U;Masci J; et al;.Proceedings of the 22nd International Joint Conference on Artificial Intelligence.2011,
[9]
Choosing Among Several Parallel Implementations of the Backpropagation Algorithm..Petrowski A;.IEEE International Conference on Neural Networks.1994,
[10]
Multi-column deep neural network for traffic sign classification.[J]..Neural Networks.2012,