TTS语音单元边界的自动切分

被引:3
作者
王丽娟
曹志刚
机构
[1] 清华大学电子工程系微波与数字通信技术国家重点实验室
关键词
前后音素相关; 边界模型; 分类与衰退树; 自动切分; TTS;
D O I
10.19304/j.cnki.issn1000-7180.2005.12.003
中图分类号
TN912.3 [语音信号处理];
学科分类号
0711 ;
摘要
语音单元边界的准确切分对基于波形拼接的语音合成系统至关重要。文章采用了两步切分方法,第一步中先由基于HMM模型的强制对齐方法得到初始的边界,在第二步中提出用基于前后音素的边界模型来修正初始边界。为解决训练数据不足的问题,提出用分类与衰退树将前后因素发音相近的边界模型进行聚类。这样可以根据训练数据的多少,动态调节边界模型的数目,以保证模型训练的可靠性。在对中文语音库的实验中,自动切分的准确度由78.7%提高到91.5%。
引用
收藏
页码:8 / 11
页数:4
相关论文
共 1 条
  • [1] Auto-m atic Phonetic Segm entation. Doroteo Torre Toledano,Luis A H ernández Góm ez. IEEE Transactions on speech and audio processing,Novem ber . 2003