卷积神经网络在异常声音识别中的研究

被引:47
作者
胡涛
张超
程炳
吴小培
机构
[1] 安徽大学计算智能与信号处理教育部重点实验室
关键词
卷积神经网络; 异常声音识别; 鲁棒性; 声音特征维度;
D O I
暂无
中图分类号
TN912.34 [语音识别与设备]; TP183 [人工神经网络与计算];
学科分类号
081002 [信号与信息处理]; 140502 [人工智能];
摘要
卷积神经网络(CNNs)已广泛应用于语音识别领域中以改善传统声学模型存在的鲁棒性弱、实时性差、识别性能低等缺点。本文对卷积神经网络在异常声音识别任务中的适用性及其识别性能进行了研究,针对日常常见的6种不同异常声音样本,分析了不同声音特征的维度对卷积神经网络识别性能的影响,还将卷积神经网络分别与高斯混合模型、BP神经网络进行比较。实验结果表明,无噪声条件下,一维特征在卷积神经网络中的平均识别率比二维特征相对提升了2.91%,且误差收敛速度更快,但在有噪声条件下,二维特征的平均识别率比一维特征相对提升了3.41%。同时卷积神经网络比其他两种识别模型在对噪声的鲁棒性和误差收敛速度等方面均有明显的优势。
引用
收藏
页码:357 / 367
页数:11
相关论文
共 4 条
[1]
基于卷积神经网络的连续语音识别 [J].
张晴晴 ;
刘勇 ;
潘接林 ;
颜永红 .
工程科学学报, 2015, 37 (09) :1212-1217
[2]
Convolutional neural networks for speech recognition[J] Ossama Abdel-Hamid;Abdel-Rahman Mohamed;Hui Jiang;Li Deng;Gerald Penn;Dong Yu IEEE/ACM Transactions on Audio; Speech and Langua 2014,
[3]
Real-world acoustic event detection[J] Xiaodan Zhuang;Xi Zhou;Mark A. Hasegawa-Johnson;Thomas S. Huang Pattern Recognition Letters 2010,
[4]
Enhancement Artificial Neural Networks for Low-Bit Rate Speech Compression system Srinonchat J; Communications and Information Technologies;2006.ISCIT''06.International Symposium on 2006,