普通话语音情感识别的特征选择技术

被引:14
作者
谢波
陈岭
陈根才
陈纯
机构
[1] 浙江大学计算机科学与技术学院
基金
浙江省自然科学基金;
关键词
情感计算; 语音情感识别; 情感声学特征; 特征选择; 普通话;
D O I
暂无
中图分类号
TP391.42 [];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
针对情感声学特征在语音情感识别中的重要性问题,运用优先选择、序列前向、序列后向和逐步判别分析进行了特征选择.对说话人和文本均无关、说话人相关2组普通话情感语音进行特征选择,然后利用线性判别分析和支持向量机进行实际识别效果的分析比较.特征选择结果表明,基频、对数能量、语速和第一共振峰均值对普通话情感语音具有较强的判别能力,但情感声学特征的判别力随着说话人的不同而有所差异.特征选择方法比较实验表明,逐步判别分析比其他3种方法具有更高的平均准确率,当特征个数为9~12时分类器的平均准确率最高.效用分析表明,特征选择在小样本时更加有效.
引用
收藏
页码:1816 / 1822
页数:7
相关论文
共 4 条
[1]   利用模糊熵进行参数有效性分析的语音情感识别 [J].
王治平 ;
赵力 ;
邹采荣 .
电路与系统学报, 2003, (03) :109-112
[2]  
多元统计分析[M]. 科学出版社 , 袁志发,周静芋主编, 2002
[3]   Emotion recognition in speech using neural networks [J].
Nicholson, J ;
Takahashi, K ;
Nakatsu, R .
NEURAL COMPUTING & APPLICATIONS, 2000, 9 (04) :290-296
[4]  
Toward the simulation of emotion in synthetic speech: a review of the literature on human vocal emotion. Murray I R,Arnott J L. The Journal of The Acoustical Society of America . 1993