基于HMM的可训练中文语音合成

被引:17
作者
吴义坚
王仁华
机构
[1] 中国科学技术大学
关键词
计算机应用; 中文信息处理; 语音合成; HMM; 可训练语音合成; 时长模型;
D O I
暂无
中图分类号
TP391.42 [];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
本文将基于HMM的可训练语音合成方法应用到中文语音合成。通过对HMM建模参数的合理选择和优化,并基于中文语音特性设计上下文属性集以及用于模型聚类的问题集,提高其建模和训练效果。从对比评测实验结果来看,98.5%的合成语音在改进后其音质得到改善。此外,针对合成语音节奏感不强的问题,提出了一种基于状态和声韵母单元的两层模型用于时长建模和预测,集外时长预测RMSE由29.56m s降为27.01m s。从最终的合成系统效果来看,合成语音整体稳定流畅,而且节奏感也比较强。由于合成系统所需的存贮量非常小,特别适合嵌入式应用。
引用
收藏
页码:75 / 81
页数:7
相关论文
empty
未找到相关数据