基于神经网络的藏语语音合成

被引:12
作者
都格草
才让卓玛
南措吉
算太本
机构
[1] 青海师范大学计算机学院藏文智能信息处理与机器翻译重点实验室
关键词
藏语语音合成; 神经网络; Sequence to Sequence模型; 注意力机制;
D O I
暂无
中图分类号
TP183 [人工神经网络与计算]; TN912.33 [语音合成];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ; 0711 ;
摘要
语音合成是人机交互的核心技术之一,也是中文信息处理领域的一项前沿技术。随着神经网络理论的不断深入,基于神经网络的语音合成技术越来越引起人们的关注。该文通过分析藏文字结构与藏语拼读规则,融合Sequence to Sequence模型和注意力机制,研究了基于神经网络的藏语语音合成技术。实验数据表明,该文方法在藏语语音合成上具有良好的性能表现。
引用
收藏
页码:75 / 80
页数:6
相关论文
共 22 条
[1]  
藏语三大方言比较研究[D]. 羊忠旦增.中央民族大学 2013
[2]   基于HMM模型的藏语语音合成研究 [J].
周雁 ;
赵栋材 .
计算机应用与软件, 2015, 32 (05) :171-174
[3]   藏语语音合成单元选择 [J].
才让卓玛 ;
李永明 ;
才智杰 .
软件学报, 2015, 26 (06) :1409-1420
[4]   语音合成方法和发展综述 [J].
张斌 ;
全昌勤 ;
任福继 .
小型微型计算机系统, 2016, 37 (01) :186-192
[5]   基于语料库的藏语语音合成单元选择算法 [J].
才让卓玛 ;
才智杰 .
中文信息学报, 2017, 31 (05) :59-63
[6]  
Sequence-tosequence models can directly translate foreign speech. Weiss R J,Chorowski J,Jaitly N,et al. . 2017
[7]  
Prosody modeling for syllable based text-to-speech synthesis using feedforward neural networks[J] . V. Ramu Reddy,K. Sreenivasa Rao. &nbspNeurocomputing . 2016
[8]   Statistical parametric speech synthesis [J].
Zen, Heiga ;
Tokuda, Keiichi ;
Black, Alan W. .
SPEECH COMMUNICATION, 2009, 51 (11) :1039-1064
[9]  
A light-weight method of building an LSTM-RNN-based bilingual tts system. Ming H,et al. Proceedings of International Conference on Asian Language Processing . 2017
[10]  
A critical review of recurrent neural networks for sequence learning. Lipton Z C,Berkowitz J,Elkan C. . 2015