基于神经网络的藏语语音合成

被引：12

作者：

都格草

才让卓玛

南措吉

算太本

机构：

[1] 青海师范大学计算机学院藏文智能信息处理与机器翻译重点实验室

来源：

中文信息学报 | 2019年 / 02期

关键词：

藏语语音合成; 神经网络; Sequence to Sequence模型; 注意力机制;

D O I：

暂无

中图分类号：

TP183 [人工神经网络与计算]; TN912.33 [语音合成];

学科分类号：

081104 ; 0812 ; 0835 ; 1405 ; 0711 ;

摘要：

语音合成是人机交互的核心技术之一,也是中文信息处理领域的一项前沿技术。随着神经网络理论的不断深入,基于神经网络的语音合成技术越来越引起人们的关注。该文通过分析藏文字结构与藏语拼读规则,融合Sequence to Sequence模型和注意力机制,研究了基于神经网络的藏语语音合成技术。实验数据表明,该文方法在藏语语音合成上具有良好的性能表现。

引用

页码：75 / 80

页数：6

共 22 条

[1]

藏语三大方言比较研究[D]. 羊忠旦增.中央民族大学 2013

[2] 基于HMM模型的藏语语音合成研究 [J].

周雁 ;

赵栋材 .

计算机应用与软件, 2015, 32 (05) :171-174

[3] 藏语语音合成单元选择 [J].

才让卓玛 ;

李永明 ;

才智杰 .

软件学报, 2015, 26 (06) :1409-1420

[4] 语音合成方法和发展综述 [J].

张斌 ;

全昌勤 ;

任福继 .

小型微型计算机系统, 2016, 37 (01) :186-192

[5] 基于语料库的藏语语音合成单元选择算法 [J].

才让卓玛 ;

才智杰 .

中文信息学报, 2017, 31 (05) :59-63

[6]

Sequence-tosequence models can directly translate foreign speech. Weiss R J,Chorowski J,Jaitly N,et al. . 2017

[7]

Prosody modeling for syllable based text-to-speech synthesis using feedforward neural networks[J] . V. Ramu Reddy,K. Sreenivasa Rao. &nbspNeurocomputing . 2016

[8] Statistical parametric speech synthesis [J].

Zen, Heiga ;

Tokuda, Keiichi ;

Black, Alan W. .

SPEECH COMMUNICATION, 2009, 51 (11) :1039-1064

[9]

A light-weight method of building an LSTM-RNN-based bilingual tts system. Ming H,et al. Proceedings of International Conference on Asian Language Processing . 2017

[10]

A critical review of recurrent neural networks for sequence learning. Lipton Z C,Berkowitz J,Elkan C. . 2015

← 1 2 3 →