基于标点信息和统计语言模型的语音停顿预测

被引:8
作者
钱揖丽 [1 ,2 ]
荀恩东 [3 ]
机构
[1] 北京工业大学计算机科学学院
[2] 山西大学计算机与信息技术学院
[3] 北京语言大学信息科学学院
关键词
标点符号; 语音停顿; 统计语言模型; 语料获取;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
语音停顿被认为是有声语言的标点符号.在语言交流中,说话人会在韵律短语的边界处插入长短不同的停顿.利用这一性质,在调查标点符号停顿作用的基础上,提出基于标点信息预测语音停顿的思想,阐述基于标点和统计模型的训练语料自动获取以及语音停顿预测方法,讨论训练语料规模对模型性能的影响,并比较基于标点信息的自动获取语料与人工标注语料的性能.实验结果显示,汉语的标点提供有价值的停顿信息,基于汉语标点信息能够有效预测语音停顿.
引用
收藏
页码:541 / 545
页数:5
相关论文
共 8 条
[1]   基于概率频度的普通话韵律结构预测统计模型 [J].
郑敏 ;
蔡莲红 .
清华大学学报(自然科学版), 2006, (01) :78-81
[2]   基于最大熵模型的韵律短语边界预测 [J].
李剑锋 ;
胡国平 ;
王仁华 .
中文信息学报, 2004, (05) :56-63
[3]   言语产生中的韵律生成 [J].
杨锦陈 ;
杨玉芳 .
心理科学进展, 2004, (04) :481-488
[4]   汉语语句中短语间停顿的自动预测方法 [J].
聂鑫 ;
王作英 .
中文信息学报, 2003, (04) :39-44
[5]   基于语法信息的汉语韵律结构预测 [J].
曹剑芬 .
中文信息学报, 2003, (03) :41-46
[6]   基于规则学习的韵律结构预测 [J].
赵晟 ;
陶建华 ;
蔡莲红 .
中文信息学报, 2002, (05) :30-37
[7]   基于边界点词性特征统计的韵律短语切分 [J].
牛正雨 ;
柴佩琪 .
中文信息学报, 2001, (05) :19-25
[8]   基于结构助词驱动的韵律短语界定的研究 [J].
应宏 ;
蔡莲红 .
中文信息学报, 1999, (06) :41-46+64