面向中文语音情感识别的改进栈式自编码结构

被引:7
作者
朱芳枚 [1 ]
赵力 [1 ]
梁瑞宇 [1 ,2 ]
王青云 [2 ]
邹采荣 [1 ]
机构
[1] 东南大学水声信号处理教育部重点实验室
[2] 南京工程学院通信工程学院
基金
中国博士后科学基金;
关键词
语音情感识别; 改进的栈式自编码; 降噪自编码; 稀疏自编码;
D O I
暂无
中图分类号
TN912.34 [语音识别与设备];
学科分类号
0711 ;
摘要
为进一步提高汉语语音情感识别率,基于深度学习中的自编码、降噪自编码及稀疏自编码的网络结构,提出了一种改进的栈式自编码结构.该结构第1层使用降噪自编码学习一个比输入特征维数更大的隐藏特征,第2层采用稀疏自编码学习稀疏性特征,最后使用softmax分类器进行分类识别.训练过程首先采用逐层预训练的方法,达到网络参数全面初始化的目的,然后对整个网络进行微调.在中文语音库上的情感识别实验显示,相较于单独使用栈式降噪或稀疏自编码,所提结构具有更好的识别效果.此外,基于CASIA库的对比实验显示,该结构比K近邻算法、稀疏表示方法、传统支持向量机和人工神经网络识别率分别提高了53.7%,29.8%,14.3%和1.9%.在自行录制的语音库中,该结构的识别率比人工神经网络提高了1.64%.
引用
收藏
页码:631 / 636
页数:6
相关论文
共 5 条
[1]   基于LDA+kernel-KNNFLC的语音情感识别方法 [J].
张昕然 ;
查诚 ;
徐新洲 ;
宋鹏 ;
赵力 .
东南大学学报(自然科学版), 2015, 45 (01) :5-11
[2]   情感语音数据库综述 [J].
韩文静 ;
李海峰 .
智能计算机与应用, 2013, 3 (01) :5-7
[3]   基于语音声学特征的情感信息识别 [J].
蒋丹宁 ;
蔡莲红 .
清华大学学报(自然科学版), 2006, (01) :86-89
[4]  
Weighted spectral features based on local Hu moments for speech emotion recognition[J] . Yaxin Sun,Guihua Wen,Jiabing Wang.Biomedical Signal Processing and Control . 2014
[5]   A tutorial on Support Vector Machines for pattern recognition [J].
Burges, CJC .
DATA MINING AND KNOWLEDGE DISCOVERY, 1998, 2 (02) :121-167