基于改进的隐马尔科夫模型的汉语词性标注

被引:10
作者
王敏
郑家恒
机构
[1] 山西大学计算机与信息技术学院
关键词
中文信息处理; 词性标注; 隐马尔科夫模型; 平滑算法; 未登录词;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
基于传统隐马尔科夫(HMM)模型的基础上,对词语的词汇发射概率做出了新的假设,从而更好地体现了该词语与上下文依赖关系。还利用指数线性插值平滑算法对参数进行了有效平滑,并且给出了未登录词词汇发射概率估计模型。实验结果证明,改进后的模型明显优于传统HMM词性标注模型的效果。
引用
收藏
页码:197 / 198+207 +207
页数:3
相关论文
empty
未找到相关数据