学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
考虑情感程度相对顺序的维度语音情感识别
被引:2
作者
:
韩文静
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机学院
韩文静
李海峰
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机学院
李海峰
论文数:
引用数:
h-index:
机构:
马琳
机构
:
[1]
哈尔滨工业大学计算机学院
来源
:
信号处理
|
2011年
/ 27卷
/ 11期
基金
:
高等学校博士学科点专项科研基金;
关键词
:
维度语音情感识别;
情感空间;
Kullback-Leibler距离;
神经网络;
梯度下降;
D O I
:
暂无
中图分类号
:
TN912.34 [语音识别与设备];
学科分类号
:
0711 ;
摘要
:
维度语音情感识别(Dim-SER)是情感计算领域的一个新兴分支,它从多维、连续的角度看待情感,将SER问题建模为连续值的预测回归任务。当前的Dim-SER系统在进行情感预测时缺少对语料间情感程度相对顺序的考虑,严重影响了人机交互系统对说话人情感变化趋势的把握。从该需求出发,本文以人类情感认知特性为参照,构建了一个对情感程度相对顺序敏感的Dim-SER系统,并引入Gamma统计对SER系统性能评价标准加以完善。系统构建过程中,本文构造了Top-rank概率分布对语料间的情感顺序进行描述,并使用Kullback-Leibler距离对预测造成的顺序一致性损失进行度量,最后提出顺序敏感的神经网络算法实现系统预测损失的最小化。情感预测实验结果表明,同常用的k近邻算法和支持向量回归算法相比,该系统有效地提高了语料间情感程度相对顺序的正确性。
引用
收藏
页码:1658 / 1663
页数:6
相关论文
共 1 条
[1]
openSMILE - The Munich Versatile and Fast Open-Source Audio Feature Extractor. Eyben,F,Wollmer,M,SchuUer.B. Proc.ACM Multimedia(MM) . 2010
←
1
→
共 1 条
[1]
openSMILE - The Munich Versatile and Fast Open-Source Audio Feature Extractor. Eyben,F,Wollmer,M,SchuUer.B. Proc.ACM Multimedia(MM) . 2010
←
1
→