基于卷积神经网络的连续语音识别

被引:66
作者
张晴晴
刘勇
潘接林
颜永红
机构
[1] 中国科学院语言声学与内容理解重点实验室
关键词
卷积神经网络; 连续语音识别; 权值共享; 聚合; 泛化性;
D O I
10.13374/j.issn2095-9389.2015.09.015
中图分类号
TN912.34 [语音识别与设备]; TP183 [人工神经网络与计算];
学科分类号
摘要
在语音识别中,卷积神经网络(convolutional neural networks,CNNs)相比于目前广泛使用的深层神经网络(deep neural network,DNNs),能在保证性能的同时,大大压缩模型的尺寸.本文深入分析了卷积神经网络中卷积层和聚合层的不同结构对识别性能的影响情况,并与目前广泛使用的深层神经网络模型进行了对比.在标准语音识别库TIMIT以及大词表非特定人电话自然口语对话数据库上的实验结果证明,相比传统深层神经网络模型,卷积神经网络明显降低模型规模的同时,识别性能更好,且泛化能力更强.
引用
收藏
页码:1212 / 1217
页数:6
相关论文
共 3 条
  • [1] 卷积神经网络的并行化研究[D]. 凡保磊.郑州大学. 2013
  • [2] ImageNet classification with deep convolutional neural networks .2 A. Krizhevsky,I. Sutskever,G. Hinton. Advances in neural information processing systems . 2012
  • [3] Applying convolutional neuralnetworks concepts to hybrid NN-HMM model for speech recognition .2 Abdel-Hamid O,Mohamed A.-r,Jiang H. et al. InternationalConference on Acoustics, Speech and Signal Processing (ICASSP) . 2012