共 6 条
汉语语句中短语间停顿的自动预测方法
被引:7
作者:
聂鑫
王作英
机构:
[1] 清华大学电子工程系
[2] 清华大学电子工程系 北京
[3] 北京
来源:
关键词:
计算机应用;
中文信息处理;
短语间停顿;
词性标注;
马尔可夫模型;
D O I:
暂无
中图分类号:
TN912.3 [语音信号处理];
学科分类号:
0711 ;
摘要:
在文语转换 (TTS)系统中 ,正确标记短语间的停顿对提高合成语音的自然度起着重要作用。本文介绍了一种在汉语语句中自动预测短语间停顿的方法。首先 ,文本进行分词 ,并转换为一列由词性标记所组成的序列 ;然后使用马尔可夫模型 ,利用人工标注数据库训练词语连接处词性标注序列的概率分布和连接类型序列的距离信息 ,得到输入的词性标记序列对应的具有最大似然概率的连接类型序列 ,最后利用后处理规则进行适当的纠错。本文针对不同的模型参数进行了测试 ,短语间停顿自动预测的召回率和连接类型正确率分别达到了 6 8 2 %和 85 1% ,取得了比较满意的结果。
引用
收藏
页码:39 / 44
页数:6
相关论文