N-gram语言模型的数据平滑技术

被引:12
作者
徐志明
王晓龙
关毅
机构
[1] 哈尔滨工业大学计算机系!
关键词
N-gram; 数据平滑; 语言模型训练;
D O I
暂无
中图分类号
TP391.43 [];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
本文主要描述了N-gram统计语言模型的几种主要的数据平滑技术;并对各种数据平滑方法进行了经验性对比;讨论了影响这些数据平滑方法性能的有关因素;如训练集规模和N─gram模型的阶数。
引用
收藏
页码:37 / 39+44 +44
页数:4
相关论文
共 1 条
[1]  
Note on the general case of the Bayes-Laplace formala for inductive or a posteriori probabilities. G.J.Lidstone. Transactions . 1920