基于最大熵模型的韵律短语边界预测

被引:20
作者
李剑锋
胡国平
王仁华
机构
[1] 中国科学技术大学讯飞语音实验室
[2] 中国科学技术大学讯飞语音实验室 安徽合肥
[3] 安徽合肥
关键词
计算机应用; 中文信息处理; 韵律短语边界预测; 最大熵; 决策树;
D O I
暂无
中图分类号
TP391.4 [模式识别与装置];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
语音合成系统中 ,由于韵律短语边界预测的水平不高 ,阻碍了合成语音自然度的进一步提高。本文根据韵律短语边界预测的特点 ,提出了基于最大熵模型的预测方法。为考察该方法的能力 ,在较大规模的数据集上 ,使用相同的属性集 ,对比了其与主流的决策树方法的预测效果。还考察了词面信息的贡献 ,以及选择特征时的不同阈值对最大熵模型的影响。实验表明 ,使用相同的属性信息 ,最大熵方法比传统的决策树方法在F Score上有 5 5 %的提高 ,加入了词面信息的最大熵模型则有 9 4 %的提高。最后指出 ,最大熵模型相当于一个带权重的规则系统 ,可以很好的解决规则冲突问题
引用
收藏
页码:56 / 63
页数:8
相关论文
共 4 条
[1]   汉语语句中短语间停顿的自动预测方法 [J].
聂鑫 ;
王作英 .
中文信息学报, 2003, (04) :39-44
[2]   基于最大熵方法的中英文基本名词短语识别 [J].
周雅倩 ;
郭以昆 ;
黄萱菁 ;
吴立德 .
计算机研究与发展, 2003, (03) :440-446
[3]   基于规则学习的韵律结构预测 [J].
赵晟 ;
陶建华 ;
蔡莲红 .
中文信息学报, 2002, (05) :30-37
[4]   基于边界点词性特征统计的韵律短语切分 [J].
牛正雨 ;
柴佩琪 .
中文信息学报, 2001, (05) :19-25