基于HMM模型的语音单元边界的自动切分

被引:4
作者
王丽娟
曹志刚
机构
[1] 清华大学电子工程系
关键词
语音单元边界; 自动切分; 隐尔马可夫模型; 文语转换系统;
D O I
10.16337/j.1004-9037.2005.04.005
中图分类号
TN912.34 [语音识别与设备];
学科分类号
摘要
基于隐尔马可夫模型(HMM)的强制对齐方法被用于文语转换系统(TTS)语音单元边界切分。为提高切分准确性,本文对HMM模型的特征选择,模型参数和模型聚类进行优化。实验表明:12维静态M e l频率倒谱系数(M FCC)是最优的语音特征;HMM模型中的状态模型采用单高斯;对于特定说话人的HMM模型,使用分类与衰退树(CART)聚类生成的绑定状态模型个数在3 000左右最优。在英文语音库中音素边界切分的实验中,切分准确率从模型优化前的77.3%提高到85.4%。
引用
收藏
页码:381 / 384
页数:4
相关论文
共 1 条
  • [1] A u tom aticphonetic segm en tation. T o ledano D T,Lu is A,Góm ez H. IEEE T ransactions onSpeech and A ud io P rocess ing . 2003