CNN卷积计算在移动GPU上的加速研究

被引:5
作者
王湘新 [1 ]
时洋 [2 ]
文梅 [2 ]
机构
[1] 武警湖南省消防总队信息中心
[2] 国防科技大学计算机学院
关键词
CNN; 手机; 移动GPU; 快速算法; OpenCL;
D O I
暂无
中图分类号
TP183 [人工神经网络与计算]; TP391.41 [];
学科分类号
080203 ;
摘要
卷积神经网络(CNN)凭借其优秀的表现正在诸如图像分类、语音识别等领域里扮演着越来越重要的角色,已经有一些研究人员想要将这个深度学习过程复制到手机上。但是,由于CNN巨大的计算量,移植程序的性能一直难以令人满意。为了探讨如何解决这一问题,借助MXNet这样一个深度学习的框架在手机上实现了CNN的前向过程,并且将注意力放在了使用手机上另一个强大的计算设备——GPU上。最终选择使用OpenCL通用编程框架将前向过程中最耗时的卷积操作利用矩阵乘来完成,并转移到GPU上进行。在此基础之上还针对手机GPU做了一些优化。最终,实验结果显示我们成功地将前向过程的时间降低到了原来时间的一半。
引用
收藏
页码:34 / 39
页数:6
相关论文
共 3 条
  • [1] 基于嵌入式移动GPU的离散傅里叶变换并行优化
    曾宝国
    杨斌
    [J]. 单片机与嵌入式系统应用, 2016, 16 (01) : 12 - 15
  • [2] 基于嵌入式移动GPU的图像编解码并行优化[D]. 龚若皓.西南交通大学. 2015
  • [3] The Application of a Convolution Neural Network on Face and License Plate Detection .2 Ying-Nong Chen,Chin-Chuan Han,Cheng-Tzu Wang,et al. 18th International Conference on Pattern Recognition,ICPR . 2006