用于说话人识别的MFCC的改进算法

被引：9

作者：

张伟伟

杨鼎才

机构：

[1] 燕山大学信息科学与工程学院

来源：

电子测量技术 | 2009年 / 32卷 / 08期

关键词：

说话人识别; 梅尔倒谱系数(MFCC); 基音频率;

D O I：

10.19651/j.cnki.emt.2009.08.031

中图分类号：

TP391.42 [];

学科分类号：

0811 ; 081101 ; 081104 ; 1405 ;

摘要：

在说话人识别系统中,MFCC参数是使用最多的特征参数之一。MFCC参数主要描述了表征声道特性的谱包络特征,而忽略了基音频率对它的影响。基音频率会影响MFCC参数对声道特性的准确描述,进而影响说话人识别系统的性能。本文提出了一种基于平滑幅度谱包络的MFCC的改进参数,该参数不直接对语音短时幅度谱进行提取,而是先对幅度谱进行平滑,在谱包络的基础上计算MFCC参数,以降低基音频率对其的影响。

引用

页码：118 / 121

页数：4

共 5 条

[1] 基于MFCC参数和VQ的说话人识别系统 [J].