最大熵和HMM在中文词性标注中的应用

被引:3
作者
余昕聪
李红莲
吕学强
机构
[1] 北京信息科技大学
关键词
隐马尔科夫模型(HMM); 最大熵模型; 未登录词; 汉语的词性标注;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
隐马尔可夫模型(HMM)基于n-元语法的标注效果虽然不错,但由于预测信息的不足,对汉语的词性标注,特别是未登录词的词性标注精度影响很大。而最大熵模型使用特征的形式,有效的利用了上下文信息,在一定的约束条件下可以得到与训练数据一致的概率分布,即使是未登录词,由于其丰富的上下文信息,对它的词性标注也起到了很好的预测作用。实验结果证明最大熵方法取得了较好的标注效果。
引用
收藏
页码:122 / 124
页数:3
相关论文
共 4 条
[1]  
基于最大熵的汉语词性标注.[D].孔海霞.大连理工大学.2007, 06
[2]   基于隐马尔科夫模型的词性标注 [J].
赵红丹 ;
王希杰 .
安阳师范学院学报, 2010, (05) :9-12
[3]   基于最大熵方法的汉语词性标注 [J].
林红 ;
苑春法 ;
郭树军 .
计算机应用, 2004, (01) :14-16
[4]   基于隐马尔可夫模型(HMM)的词性标注的应用研究 [J].
胡春静 ;
韩兆强 ;
不详 .
计算机工程与应用 , 2002, (06) :62-64