基于深层神经网络的多特征关联声学建模方法

被引:6
作者
范正光
屈丹
闫红刚
张文林
机构
[1] 解放军信息工程大学信息系统工程学院
关键词
语音识别; 深层神经网络; 声学模型; 低秩矩阵分解; 融合;
D O I
暂无
中图分类号
TN912.34 [语音识别与设备]; TP183 [人工神经网络与计算];
学科分类号
0711 ; 081104 ; 0812 ; 0835 ; 1405 ;
摘要
针对不同声学特征之间的信息互补性以及声学建模中各任务间的关联性,提出了一种多特征关联的深层神经网络声学建模方法,该方法首先借鉴深层神经网络(deep neural network,DNN)多模态以及多任务学习思想,通过共享DNN部分隐含层为不同特征声学模型间建立关联,从而挖掘不同学习任务间隐含的共同解释性因素,实现知识迁移以及性能的相互促进;其次利用低秩矩阵分解方法减少模型估计参数的数量,加快模型训练速度,并对不同特征的识别结果采用ROVER(recognizer output voting error reduction)融合算法进行融合,进一步提高系统识别性能.基于TIMIT的连续语音识别实验表明,采用关联声学建模方法,不同特征的识别性能均要优于独立建模时的识别性能.在音素错误率(phone error rates,PER)指标上,关联声学建模下的ROVER融合结果要比独立建模下的ROVER融合结果相对降低约4.6%.
引用
收藏
页码:1036 / 1044
页数:9
相关论文
共 3 条
[1]  
基于深层神经网络的声学特征提取及其在LVCSR系统中的应用[D]. 包叶波.中国科学技术大学. 2014
[2]  
Ensemble Feature Extraction Modules for Improved Hindi Speech Recognition System[J] . Kumar,Malay,Aggarwal,R K,Leekha,Gaurav,Kumar,Yogesh.EN . 2012 (3)
[3]  
Multimodal deep learning .2 Ngiam,J,Khosla,A,Kim,M.et al. 28th In.Conf.on Machine Learning . 2011