基于深度特征学习的藏语语音识别

被引:8
作者
王辉
赵悦
刘晓凤
徐晓娜
周楠
许彦敏
机构
[1] 中央民族大学信息工程学院
关键词
深度特征学习; 稀疏自动编码器; 藏语语音识别; MFCC特征;
D O I
10.16163/j.cnki.22-1123/n.2015.04.015
中图分类号
TN912.34 [语音识别与设备];
学科分类号
0711 ;
摘要
根据听觉语音学的知识,提出使用稀疏自动编码器在MFCC特征基础上进行深度学习,提取了深度特征模仿听觉神经的稀疏触动信号,有利于HMM模型语音识别精度的提高.实验结果显示,学习到的深度特征较MFCC特征在藏语语音识别正确率方面有明显提高.
引用
收藏
页码:69 / 73
页数:5
相关论文
共 6 条
[1]   深度学习研究综述 [J].
孙志军 ;
薛磊 ;
许阳明 ;
王正 .
计算机应用研究, 2012, 29 (08) :2806-2810
[2]   藏语拉萨话大词表连续语音识别声学模型研究 [J].
李冠宇 ;
孟猛 .
计算机工程, 2012, 38 (05) :189-191
[3]  
Sparse coding of the modulation spectrum for noise-robust automatic speech recognition..[J].Sara Ahmadi;Seyed Mohammad Ahadi;Bert Cranen;Lou Boves.EURASIP Journal on Audio; Speech; and Music Processing.2014, 1
[4]  
Speech recognition with artificial neural networks.[J]..Digital Signal Processing.2009, 3
[5]  
基于隐马尔科夫模型的拉萨话语音拨号技术研究.[D].徐慧.西北民族大学.2013, 05
[6]  
语音信号处理.[M].韩纪庆等编著;.清华大学出版社.2004,