基于CUDA技术的卷积神经网络识别算法

被引：35

作者：

张佳康

陈庆奎

机构：

[1] 上海理工大学光电信息与计算机工程学院

来源：

计算机工程 | 2010年 / 36卷 / 15期

关键词：

流处理器; 单指令多线程; GTX200硬件架构; CUDA技术; 卷积神经网络;

D O I：

暂无

中图分类号：

TP391.41 [];

学科分类号：

摘要：

针对具有高浮点运算能力的流处理器设备GPU对神经网络的适用性问题,提出卷积神经网络的并行化识别算法,采用计算统一设备架构(CUDA)技术,并定义其上的并行化数据结构,描述计算任务到CUDA的映射机制。实验结果证明,在GTX200硬件架构的GPU上实现的并行识别算法的平均浮点运算能力峰值较CPU上串行算法提高了近60倍,更适用于神经网络的相关应用。

引用

页码：179 / 181

页数：3