PAD三维情感空间中的语音情感识别

被引:3
作者
陈逸灵
程艳芬
陈先桥
王红霞
李超
机构
[1] 武汉理工大学计算机科学与技术学院
关键词
PAD三维情感模型; 语音情感识别; 梅尔频率倒谱系数; 时间点火序列; 点火位置信息; 相关性分析;
D O I
暂无
中图分类号
TN912.34 [语音识别与设备];
学科分类号
0711 ;
摘要
离散情感描述模型将人类情感标注为离散的形容词标签,该类模型只能表示有限种类的、单一明确的情感类型,而维度情感模型从情感的多个维度量化了复杂情感的隐含状态.另外,常用的语音情感特征梅尔频率倒谱系数(MFCC)存在因分帧处理引起相邻帧谱特征之间相关性被忽略问题,容易丢失很多有用信息.为此本文提出改进方法,从语谱图中提取时间点火序列特征、点火位置信息特征对MFCC进行补充,将这三种特征分别用于语音情感识别,根据识别结果从PAD维度情感模型的三个维度(Pleasure-displeasure愉悦度、Arousal-nonarousal激活度、Dominance-submissiveness优势度)进行相关性分析得到特征的权重系数,加权融合后获得情感语音的最终PAD值,将其映射至PAD三维情感空间中.实验表明,增加的时间点火序列、点火位置信息不但能探测说话人的情感状态,同时考虑了相邻频谱间的互相关信息,与MFCC特征形成互补,在提升基本情感类型离散识别效果的基础上,将识别结果表示为PAD三维情感空间中的坐标点,采用量化的方法揭示情感空间中各种情感的定位与联系,展示出情感语音中糅杂的情感内容,为后续复杂的语音情感分类识别奠定研究基础.
引用
收藏
页码:160 / 166
页数:7
相关论文
共 19 条
[1]  
融合LPCC和MFCC特征参数的语音识别技术的研究.[D].张文克.湘潭大学.2016, 03
[2]  
脉冲耦合神经网络(PCNN)在基于语谱图的说话人识别中的应用.[D].阮柏尧.五邑大学.2008, 12
[3]  
语音情感识别中的特征提取与识别算法研究.[D].孙亚新.华南理工大学.2015, 01
[4]  
脉冲耦合神经网络在图像处理中的应用研究.[D].李建锋.中南大学.2013, 12
[5]   基于语谱图提取瓶颈特征的情感识别算法研究 [J].
李姗 ;
徐珑婷 .
计算机技术与发展, 2017, 27 (05) :82-86
[6]   基于PAD情绪模型的情感语音识别 [J].
宋静 ;
张雪英 ;
孙颖 ;
张卫 .
微电子学与计算机, 2016, 33 (09) :128-131+136
[7]   基于多级SVM分类的语音情感识别算法 [J].
任浩 ;
叶亮 ;
李月 ;
沙学军 .
计算机应用研究, 2017, 34 (06) :1682-1684
[8]   基于PCA和SVM的普通话语音情感识别 [J].
蒋海华 ;
胡斌 .
计算机科学, 2015, 42 (11) :270-273
[9]   语音情感识别的关键技术 [J].
张雪英 ;
孙颖 ;
张卫 ;
畅江 .
太原理工大学学报, 2015, 46 (06) :629-636+643
[10]   情感语音数据库综述 [J].
韩文静 ;
李海峰 .
智能计算机与应用, 2013, 3 (01) :5-7