基于上下文的二阶隐马尔可夫模型

被引:17
作者
刘洁彬 [1 ]
宋茂强 [1 ]
赵方 [1 ]
杨志宇 [2 ]
机构
[1] 北京邮电大学软件学院
[2] 北京航天航空大学软件学院
关键词
词性标注; 二阶隐马尔可夫模型; 参数平滑; Viterbi算法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
为体现上下文信息对当前词汇词性的影响,在传统隐马尔可夫模型的基础上提出一种基于上下文的二阶隐马尔可夫模型,并应用于中文词性标注中。针对改进后的统计模型中由于训练数据过少而出现的数据稀疏问题,给出基于指数线性插值改进平滑算法,对参数进行有效平滑。实验表明,基于上下文的二阶隐马尔可夫模型比传统的隐马尔可夫模型具有更高的词性标注正确率和消歧率。
引用
收藏
页码:231 / 232+235 +235
页数:3
相关论文
共 3 条
[1]
基于完全二阶隐马尔可夫模型的汉语词性标注 [J].
梁以敏 ;
黄德根 .
计算机工程, 2005, (10) :177-179
[2]
基于统计的汉语词性标注方法的分析与改进 [J].
魏欧 ;
吴健 ;
孙玉芳 ;
sonata.iscas.ac.cn .
软件学报, 2000, (04) :473-480
[3]
知识发现.[M].史忠植著;.清华大学出版社.2002,