嗓音多频带非线性分析的声带病变识别

被引:12
作者
周强 [1 ]
张晓俊 [1 ]
顾济华 [1 ]
赵鹤鸣 [2 ]
朱俊杰 [1 ]
陶智 [1 ]
机构
[1] 苏州大学物理科学与技术学院
[2] 苏州大学电子信息学院
关键词
多频带; MFCC; 声带病变; 核函数; 嗓音; 非线性分析; 数学分析; 滤波器组; 频带信号; 主成分分析算法; KPCA; 参数选取; 识别率; 核参数; 采样频率;
D O I
10.15949/j.cnki.0371-0025.2014.01.013
中图分类号
TN911.4 [噪声与干扰];
学科分类号
081002 ;
摘要
提出了一种嗓音多频带非线性分析的声带病变识别方法,以提高声带病变嗓音的识别率。首先采用Gammatone听觉滤波器组对嗓音信号进行滤波,求取每个频带下的最大李雅普诺夫指数;对映射到核空间的数据采用高斯最大似然度准则优化核函数,然后采用优化核主成分分析算法实现特征抽取。识别实验表明,多频带最大李雅普诺夫指数的识别率比传统的MFCC和最大李雅普诺夫指数分别有6.52%和8.45%的提高,且采用优化核主成分分析算法比传统核主成分分析算法有更好的抽取效果.将多频带非线性分析和优化核主成分分析算法结合,识别率提升至97.82%。
引用
收藏
页码:111 / 118
页数:8
相关论文
共 9 条
[1]  
一种新的声带振动模型振动产生声场的研究.[D].封子阳.陕西师范大学.2012, 12
[2]   Chaos in voice, from modeling to measurement [J].
Jiang, JJ ;
Zhang, Y ;
McGilligan, C .
JOURNAL OF VOICE, 2006, 20 (01) :2-17
[3]   Perturbation and nonlinear dynamic analyses of voices from patients with unilateral laryngeal paralysis [J].
Zhang, Y ;
Jiang, JJ ;
Biazzo, L ;
Jorgensen, M .
JOURNAL OF VOICE, 2005, 19 (04) :519-528
[4]   Support vector data description [J].
Tax, DMJ ;
Duin, RPW .
MACHINE LEARNING, 2004, 54 (01) :45-66
[5]   Choosing multiple parameters for support vector machines [J].
Chapelle, O ;
Vapnik, V ;
Bousquet, O ;
Mukherjee, S .
MACHINE LEARNING, 2002, 46 (1-3) :131-159
[6]   Determination of largest Lyapunov exponents of vocal signal: Application to unilateral laryngeal paralysis [J].
Giovanni, A ;
Ouaknine, M ;
Triglia, JL .
JOURNAL OF VOICE, 1999, 13 (03) :341-354
[7]  
Support vector domain description.[J].David M.J Tax;Robert P.W Duin.Pattern Recognition Letters.1999, 11
[8]   Nonlinear component analysis as a kernel eigenvalue problem [J].
Scholkopf, B ;
Smola, A ;
Muller, KR .
NEURAL COMPUTATION, 1998, 10 (05) :1299-1319
[9]  
Spectro-temporal receptive fields of auditory neurons in the grassfrog.[J].A. M. H. J. Aertsen;P. I. M. Johannesma.Biological Cybernetics.1980, 4