深度神经网络在维吾尔语大词汇量连续语音识别中的应用

被引:11
作者
麦麦提艾力吐尔逊 [1 ,2 ]
戴礼荣 [1 ]
机构
[1] 中国科学技术大学语音及语言信息处理国家工程实验室
[2] 新疆师范大学计算机科学技术学院
关键词
深度神经网络; 维吾尔语; GMM-HMM; 瓶颈特征;
D O I
10.16337/j.1004-9037.2015.02.015
中图分类号
TN912.34 [语音识别与设备];
学科分类号
摘要
研究将深度神经网络有效地应用到维吾尔语大词汇量连续语音识别声学建模中的两种方法:深度神经网络与隐马尔可夫模型组成混合架构模型(Deep neural network hidden Markov model,DNNHMM),代替高斯混合模型进行状态输出概率的计算;深度神经网络作为前端的声学特征提取器提取瓶颈特征(Bottleneck features,BN),为传统的GMM-HMM(Gaussian mixture model-HMM)声学建模架构提供更有效的声学特征(BN-GMM-HMM)。实验结果表明,DNN-HMM模型和BN-GMM-HMM模型比GMM-HMM基线模型词错误率分别降低了8.84%和5.86%,两种方法都取得了较大的性能提升。
引用
收藏
页码:365 / 371
页数:7
相关论文
共 4 条
  • [1] 深度语音信号与信息处理:研究进展与展望
    戴礼荣
    张仕良
    [J]. 数据采集与处理, 2014, 29 (02) : 171 - 179
  • [2] 自然语言处理综论[M]. 电子工业出版社 , (美)DanielJurafsky, 2005
  • [3] Investigation of deep neural networks (DNN) for largevocabulary continuous speech recognition: Why DNN surpasses GMMs in acousticmodeling .2 Pan J,Liu C,Wang Z,et al. Chinese Spoken Language Processing (ISCSLP),20128th InternationalSymposium on . 2012
  • [4] A maximum likelihood approach to continuous speech recognition .2 Bahl LR,Jelinek F,Mwecer RL. IEEE Transactions on Pattern Analysis and Machine Intelligence . 1983