利用深度卷积神经网络提高未知噪声下的语音增强性能

被引:39
作者
袁文浩 [1 ]
孙文珠 [1 ]
夏斌 [1 ]
欧世峰 [2 ]
机构
[1] 山东理工大学计算机科学与技术学院
[2] 烟台大学光电信息科学技术学院
关键词
语音增强; 深度卷积神经网络; 深度神经网络; 噪声;
D O I
10.16383/j.aas.2018.c170001
中图分类号
TN912.3 [语音信号处理]; TP18 [人工智能理论];
学科分类号
0711 ; 081104 ; 0812 ; 0835 ; 1405 ;
摘要
为了进一步提高基于深度学习的语音增强方法在未知噪声下的性能,本文从神经网络的结构出发展开研究.基于在时间与频率两个维度上,语音和噪声信号的局部特征都具有强相关性的特点,采用深度卷积神经网络(Deep convolutional neural network,DCNN)建模来表示含噪语音和纯净语音之间的复杂非线性关系.通过设计有效的训练特征和训练目标,并建立合理的网络结构,提出了基于深度卷积神经网络的语音增强方法.实验结果表明,在未知噪声条件下,本文方法相比基于深度神经网络(Deep neural network,DNN)的方法在语音质量和可懂度两种指标上都有明显提高.
引用
收藏
页码:751 / 759
页数:9
相关论文
共 7 条
[1]   基于深度学习语音分离技术的研究现状与进展 [J].
刘文举 ;
聂帅 ;
梁山 ;
张学良 .
自动化学报, 2016, 42 (06) :819-833
[2]   Very Deep Convolutional Neural Networks for Noise Robust Speech Recognition [J].
Qian, Yanmin ;
Bi, Mengxiao ;
Tan, Tian ;
Yu, Kai .
IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2016, 24 (12) :2263-2276
[3]  
Noise perturbation for supervised speech separation[J] . Jitong Chen,Yuxuan Wang,DeLiang Wang.Speech Communication . 2015
[4]  
Deep Convolutional Neural Networks for Large-scale Speech Tasks[J] . Tara N. Sainath,Brian Kingsbury,George Saon,Hagen Soltau,Abdel-rahman Mohamed,George Dahl,Bhuvana Ramabhadran.Neural Networks . 2015
[5]   A Regression Approach to Speech Enhancement Based on Deep Neural Networks [J].
Xu, Yong ;
Du, Jun ;
Dai, Li-Rong ;
Lee, Chin-Hui .
IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2015, 23 (01) :7-19
[6]   On Training Targets for Supervised Speech Separation [J].
Wang, Yuxuan ;
Narayanan, Arun ;
Wang, DeLiang .
IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2014, 22 (12) :1849-1858
[7]  
Exploring Convolutional Neural Network Structures and Optimization Techniques for Speech Recognition .2 Abdel-Hamid,O,Deng,L,Yu,D. Annual Conference of the International Speech Communication Association . 2013