基于标点信息和统计语言模型的语音停顿预测

被引：8

作者：

钱揖丽 ^{[1
,2
]}

荀恩东 ^{[3
]}

机构：

[1] 北京工业大学计算机科学学院

[2] 山西大学计算机与信息技术学院

[3] 北京语言大学信息科学学院

来源：

模式识别与人工智能 | 2008年 / 21卷 / 04期

关键词：

标点符号; 语音停顿; 统计语言模型; 语料获取;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

摘要：

语音停顿被认为是有声语言的标点符号.在语言交流中,说话人会在韵律短语的边界处插入长短不同的停顿.利用这一性质,在调查标点符号停顿作用的基础上,提出基于标点信息预测语音停顿的思想,阐述基于标点和统计模型的训练语料自动获取以及语音停顿预测方法,讨论训练语料规模对模型性能的影响,并比较基于标点信息的自动获取语料与人工标注语料的性能.实验结果显示,汉语的标点提供有价值的停顿信息,基于汉语标点信息能够有效预测语音停顿.

引用

页码：541 / 545

页数：5

共 8 条

[1] 基于概率频度的普通话韵律结构预测统计模型 [J].