基于MFCC的语音情感识别

被引:27
作者
韩一 [1 ]
王国胤 [1 ,2 ]
杨勇 [1 ,2 ]
机构
[1] 重庆邮电大学计算机学院
[2] 西南交通大学计算机学院
关键词
MFCC; 语音情感识别; 情感计算;
D O I
暂无
中图分类号
TN912.3 [语音信号处理];
学科分类号
0711 ;
摘要
情感语音中携带着丰富的信息,在人机交互领域有着广阔的应用。Mel频率是基于人耳听觉特性提出来的,它与Hz频率成非线性对应关系。Mel频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征,MFCC已经广泛地应用在语音识别领域。由于Mel频率与Hz频率之间非线性的对应关系,使得MFCC随着频率的提高,其计算精度随之下降。因此,在应用中常常只使用低频MFCC,而丢弃中高频MFCC。针对该问题进行了研究,修正了Hz-Mel非线性对应关系,提升了中高频系数的计算精度,并将其作为低频MFCC的补充,应用到语音情感识别中。实验证明,改进之后的算法与经典算法比较,在不同的特征组合上识别率都有不同程度的提高,从而证明了Mid MFCC特征计算方法的有效性。
引用
收藏
页码:597 / 602
页数:6
相关论文
共 1 条
[1]   基于语音声学特征的情感信息识别 [J].
蒋丹宁 ;
蔡莲红 .
清华大学学报(自然科学版), 2006, (01) :86-89