采用特征分类直方图均衡化的鲁棒性语音识别

被引:4
作者
姜莹
俞一彪
机构
[1] 苏州大学电子信息学院
关键词
语音识别; 直方图均衡化; 特征分类; 鲁棒性;
D O I
暂无
中图分类号
TN912.34 [语音识别与设备];
学科分类号
摘要
大部分噪声会引起语音倒谱域特征参数的非线性失真,导致识别系统性能下降。直方图均衡化方法是一种非线性补偿变换技术,较传统的基于线性变换技术的抗噪声方法进一步提高了系统的鲁棒性。但实际识别系统中,除了噪声引起语音特征的非线性失真外,还存在训练和测试数据的语音特征类分布不一致问题,从而难以保证传统的直方图均衡化方法发挥其优势。本文提出一种基于特征分类的直方图均衡化方法,首先对初步均衡化后的含噪语音特征矢量进行K均值分类,然后对各类别下的特征矢量再进行直方图均衡变换。实验结果表明,低信噪比时无论在平稳噪声还是非平稳噪声环境下,与传统的直方图均衡化方法相比都进一步增强了识别系统的鲁棒性。
引用
收藏
页码:896 / 900
页数:5
相关论文
共 10 条
[1]  
The HTK Book[OL]. SteveYong,etc. http://htk.eng.cam.ac.uk/ . 2002
[2]   基于双高斯GMM的特征参数规整及其在语音识别中的应用 [J].
刘波 ;
戴礼荣 ;
王仁华 ;
杜俊 ;
李锦宇 .
自动化学报, 2006, (04) :519-525
[3]  
Feature extraction combining spectral noise reduction and cepstral histogram equalization for robust ASR. JC.Segura,MC, Benitez,A. Torre, et al. Proceedings of the 7th International Conference on Spoken Language Processing . 2002
[4]  
Quantile based histogram equation for online application. F. Hilger,S. Molau,H. Ney. ICSLP2002 . 2002
[5]  
Cepstral domain segmental feature vector normalization for noise robust speech recognition[J] . Olli Viikki,Kari Laurila. &nbspSpeech Communication . 1998 (1)
[6]  
VTS residual noise compensation. Segura J C,Benitez M C,de la Torre A. Proceedings of International Conference on Acoustics and Signal Processing 2002 . 2002
[7]  
Cepstral Domain Segmental Nonlinear Feature Transformations for Robust Speec Recognition. J.C.Segura,C.Benltez,A.de la Torre,A.J.Rubio,J. Ramirez. IEEE Signal Processing Letters . 2004
[8]  
Filtering of Filter-Bank Energies for Robust Speech Recognition. H.Y.Jun. ETRI Journal . 2004
[9]  
Digital Image Processing. Rafael C Gonzalez,Richard E Woods. . 2002
[10]  
Cepstral domain segmental feature vector normalization for noise robust speech recognition. Olli Vikki,Kari Laurila. Speech Communication . 1998