基于MFCC和LPCC的说话人识别

被引:135
作者
余建潮
张瑞林
机构
[1] 浙江理工大学
基金
浙江省自然科学基金;
关键词
LPCC; MFCC; 特征提取; 说话人识别; 神经网络; K均值算法;
D O I
10.16208/j.issn1000-7024.2009.05.010
中图分类号
TN912.34 [语音识别与设备];
学科分类号
081002 [信号与信息处理];
摘要
MFCC参数和LPCC参数是说话人识别中两种最常用的特征参数,研究了MFCC和LPCC参数提取的算法原理及差分倒谱参数的提取方法,采用MFCC、LPCC及其一阶、二阶差分作为特征参数,通过k均值算法与三层BP神经网络来进行说话人识别。实验结果表明,该方法可以有效提高识别率,同时也验证MFCC参数的鲁棒性优于LPCC参数。
引用
收藏
页码:1189 / 1191
页数:3
相关论文
共 8 条
[1]
语音信号处理.[M].韩纪庆等编著;.清华大学出版社.2004,
[2]
现代语音技术基础与应用.[M].蔡莲红等编著;.清华大学出版社.2003,
[3]
MATLAB扩展编程.[M].何强;何英编著;.清华大学出版社.2002,
[4]
噪声环境下MFCC特征提取 [J].
宫晓梅 ;
王怀阳 .
微计算机信息, 2007, (22) :247-249
[5]
概率神经网络在文本无关说话人识别中的应用 [J].
周长锋 ;
韩力群 .
北京工商大学学报(自然科学版), 2007, (01) :49-51
[6]
一种用于文本聚类的改进的K均值算法 [J].
任江涛 ;
孙婧昊 ;
施潇潇 ;
黄焕宇 ;
印鉴 .
计算机应用, 2006, (S1) :73-75
[7]
一种基于MFCC和LPCC的文本相关说话人识别方法 [J].
于明 ;
袁玉倩 ;
董浩 ;
王哲 .
计算机应用, 2006, (04) :883-885
[8]
作为说话人识别特征参量的M FCC的提取过程 [J].
丁爱明 .
电子工程师, 2006, (01) :51-53