语音识别和说话人识别中各倒谱分量的相对重要性

被引:75
作者
甄斌
吴玺宏
刘志敏
迟惠生
机构
[1] 北京大学信息科学中心!
[2] 北京
基金
北京市自然科学基金;
关键词
MFCC; 说话人识别; 语音识别;
D O I
10.13209/j.0479-8023.2001.072
中图分类号
TN912.3 [语音信号处理];
学科分类号
0711 ;
摘要
采用增减特征分量的方法研究了MFCC各维倒谱分量对说话人识别和语音识别的贡献。使用DTW测度 ,在标准英文数字语音库上的实验表明 ,最有用的语音信息包含在MFCC分量C1到C12 之间 ,最有用的说话人信息包含在MFCC分量C2 到C16之间。MFCC分量C0 和C1包含有负作用的说话人信息 ,将其作为特征会引起识别率的降低。低阶MFCC分量较高阶分量更容易受加性噪声和卷积噪声干扰
引用
收藏
页码:371 / 378
页数:8
相关论文
共 1 条
[1]  
语音信号数字处理.[M].杨行峻;迟惠生等编著;.电子工业出版社.1995,