用于说话人识别的MFCC的改进算法

被引:9
作者
张伟伟
杨鼎才
机构
[1] 燕山大学信息科学与工程学院
关键词
说话人识别; 梅尔倒谱系数(MFCC); 基音频率;
D O I
10.19651/j.cnki.emt.2009.08.031
中图分类号
TP391.42 [];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
在说话人识别系统中,MFCC参数是使用最多的特征参数之一。MFCC参数主要描述了表征声道特性的谱包络特征,而忽略了基音频率对它的影响。基音频率会影响MFCC参数对声道特性的准确描述,进而影响说话人识别系统的性能。本文提出了一种基于平滑幅度谱包络的MFCC的改进参数,该参数不直接对语音短时幅度谱进行提取,而是先对幅度谱进行平滑,在谱包络的基础上计算MFCC参数,以降低基音频率对其的影响。
引用
收藏
页码:118 / 121
页数:4
相关论文
共 5 条
[1]   基于MFCC参数和VQ的说话人识别系统 [J].
王伟 ;
邓辉文 .
仪器仪表学报, 2006, (S3) :2253-2255
[2]   二次特征提取及其在说话人识别中的应用 [J].
马志友 ;
杨莹春 ;
吴朝晖 .
电路与系统学报, 2003, (02) :130-133
[3]   语音识别和说话人识别中各倒谱分量的相对重要性 [J].
甄斌 ;
吴玺宏 ;
刘志敏 ;
迟惠生 .
北京大学学报(自然科学版), 2001, (03) :371-378
[4]  
语音信号处理[M]. 机械工业出版社 , 赵力编著, 2003
[5]  
Robust spectrum analysis for applicationin signal processing .2 NANDA P K,PALI WAL K K. IEEE Trans.Acoustic,Speechand SignalProcessing . 1998