情感语音特征对语料库依赖性的统计分析

被引:3
作者
孙颖
张雪英
机构
[1] 太原理工大学信息工程学院
关键词
声学; 信号处理; 情感语音识别; 语料库依赖性; 情感特征; 混合语料库;
D O I
暂无
中图分类号
TN912.34 [语音识别与设备];
学科分类号
0711 ;
摘要
简述线性预测倒谱系数(LPCC)、Teager能量算子(TEO)、梅尔频率倒谱系数(MFCC)和过零峰值幅度(ZCPA)特征提取方法,并将这四种方法应用于情感识别。设计两种实验,第一种是使用TYUT和Berlin语料库的单语言实验,这种实验证明,以上四种特征在单一的语料库单一语言条件下均能够有效地表征语音的情感特征,其中MFCC特征对情感的识别率最高。第二种实验是混合语料库的单一语言实验。之前大多数关于情感特征的研究都是基于某一种语料库中某种特定语言的,但在实际中,说话人的背景环境总是多种多样。因此,对特征的混合语料库研究是有现实意义的。第二种实验证明这四种特征都是语料库依赖性的,其中ZCPA特征的识别率下降最少。
引用
收藏
页码:132 / 136
页数:5
相关论文
共 6 条
[1]   一种孤立词语音识别的实现方法及改进 [J].
刘丽媛 ;
严家明 .
现代电子技术, 2010, 33 (16) :109-112
[2]   改进的混合MFCC语音识别算法研究 [J].
袁正午 ;
肖旺辉 .
计算机工程与应用 , 2009, (33) :108-110
[3]   情绪的心理控制与认知研究策略 [J].
罗跃嘉 ;
吴健辉 .
西南师范大学学报(人文社会科学版), 2005, (02) :26-29
[4]   一种基于听觉模型的抗噪语音识别特征提取方法 [J].
焦志平 ;
张雪英 ;
赵姝彦 ;
不详 .
太原理工大学学报 , 2005, (01) :13-15+22
[5]   An evaluation of the robustness of existing supervised machine learning approaches to the classification of emotions in speech [J].
Shami, Mohammad ;
Verhelst, Werner .
SPEECH COMMUNICATION, 2007, 49 (03) :201-212
[6]  
Emotional speech recognition: Resources, features, and methods[J] . Dimitrios Ververidis,Constantine Kotropoulos.Speech Communication . 2006 (9)