汉语语句中短语间停顿的自动预测方法

被引:7
作者
聂鑫
王作英
机构
[1] 清华大学电子工程系
[2] 清华大学电子工程系 北京
[3] 北京
关键词
计算机应用; 中文信息处理; 短语间停顿; 词性标注; 马尔可夫模型;
D O I
暂无
中图分类号
TN912.3 [语音信号处理];
学科分类号
0711 ;
摘要
在文语转换 (TTS)系统中 ,正确标记短语间的停顿对提高合成语音的自然度起着重要作用。本文介绍了一种在汉语语句中自动预测短语间停顿的方法。首先 ,文本进行分词 ,并转换为一列由词性标记所组成的序列 ;然后使用马尔可夫模型 ,利用人工标注数据库训练词语连接处词性标注序列的概率分布和连接类型序列的距离信息 ,得到输入的词性标记序列对应的具有最大似然概率的连接类型序列 ,最后利用后处理规则进行适当的纠错。本文针对不同的模型参数进行了测试 ,短语间停顿自动预测的召回率和连接类型正确率分别达到了 6 8 2 %和 85 1% ,取得了比较满意的结果。
引用
收藏
页码:39 / 44
页数:6
相关论文
共 6 条
[1]   文语转换系统中虚词停顿的研究 [J].
潘伟锵 ;
贺前华 ;
韦岗 .
华南理工大学学报(自然科学版), 2002, (06) :44-48
[2]   汉语韵律边界的声学实验研究 [J].
胡伟湘 ;
徐波 ;
黄泰翼 .
中文信息学报, 2002, (01) :43-48
[3]   基于边界点词性特征统计的韵律短语切分 [J].
牛正雨 ;
柴佩琪 .
中文信息学报, 2001, (05) :19-25
[4]   基于概率统计的韵律短语分析 [J].
谌卫军 ;
林福宗 ;
李建民 ;
张钹 .
计算机工程与应用, 2001, (03) :10-11+34
[5]   基于结构助词驱动的韵律短语界定的研究 [J].
应宏 ;
蔡莲红 .
中文信息学报, 1999, (06) :41-46+64
[6]   汉语短语标注标记集的确定 [J].
周强,俞士汶 .
中文信息学报, 1996, (04) :1-11