距离加权统计语言模型及其应用

被引:6
作者
金凌
吴文虎
郑方
吴根清
机构
[1] 清华大学计算机科学与技术系
关键词
N-gram; 关联词模型; 距离加权; 数据平滑;
D O I
暂无
中图分类号
TN912.3 [语音信号处理];
学科分类号
0711 ;
摘要
本文在统计语言模型构造中 ,提出了将词间距离信息结合到N gram统计语言模型中的思路 ,并称之为距离加权的关联词统计语言模型。该模型可以考虑一个句子中非相邻词之间的关系 ,基于“词距越近关系越密切”的原则 ,通过距离加权函数来引入距离信息 ,提高模型的预测能力。本文还将其应用到一个中文整句拼音输入法系统中。实验表明 ,该模型与传统的N gram统计语言模型相比 ,汉字误识率有所降低 ,模型性能有了一定提高
引用
收藏
页码:47 / 52
页数:6
相关论文
共 1 条
[1]  
Improving the syllable-synchronous network search algorithm for word decoding in continuous Chinese speech recognition[J] . Fang Zheng,Jian Wu,Zhanjiang Song.Journal of Computer Science and Technology . 2000 (5)