基于CUDA技术的卷积神经网络识别算法

被引:35
作者
张佳康
陈庆奎
机构
[1] 上海理工大学光电信息与计算机工程学院
关键词
流处理器; 单指令多线程; GTX200硬件架构; CUDA技术; 卷积神经网络;
D O I
暂无
中图分类号
TP391.41 [];
学科分类号
摘要
针对具有高浮点运算能力的流处理器设备GPU对神经网络的适用性问题,提出卷积神经网络的并行化识别算法,采用计算统一设备架构(CUDA)技术,并定义其上的并行化数据结构,描述计算任务到CUDA的映射机制。实验结果证明,在GTX200硬件架构的GPU上实现的并行识别算法的平均浮点运算能力峰值较CPU上串行算法提高了近60倍,更适用于神经网络的相关应用。
引用
收藏
页码:179 / 181
页数:3
相关论文
共 2 条
[1]
基于CUDA的尺度不变特征变换快速算法 [J].
田文 ;
徐帆 ;
王宏远 ;
周波 .
计算机工程, 2010, 36 (08) :219-221
[2]
基于分流抑制机制的卷积神经网络人脸检测法 [J].
肖柏旭 ;
张丽静 .
计算机应用, 2006, (S1) :46-48