应用二叉树剪枝识别韵律短语边界

被引:5
作者
荀恩东 [1 ]
钱揖丽 [1 ]
郭庆 [2 ]
宋柔 [1 ]
机构
[1] 北京语言大学语言信息处理研究所
[2] 富士通研究开发中心
关键词
人工智能; 自然语言处理; 统计语言模型; 二叉树; 韵律短语; 最大熵;
D O I
暂无
中图分类号
TP391.42 [];
学科分类号
摘要
句子的韵律短语识别是语音合成的重要研究内容。本文提出了应用统计语言模型生成的二叉树,结合最大熵方法识别待合成汉语句子的语音停顿点。文中给出了二叉树相关的模型训练和生成算法;二叉树与语音停顿点之间的关系;在最大熵方法中应用二叉树剪枝识别句子的韵律短语。实验结果表明,在搜索算法中,利用二叉树进行剪枝,可以很大程度上提高语音停顿预测的正确率和召回率,基于试验数据的f-Score提高了近35%。
引用
收藏
页码:1 / 5+28 +28
页数:6
相关论文
共 10 条