共 1 条
基于最大熵方法的汉语词性标注
被引:9
作者:
林红
苑春法
郭树军
机构:
[1] 河北省气象局省气象台
[2] 清华大学计算机科学与技术系
来源:
关键词:
语言模型;
最大熵模型;
词性标注;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
摘要:
最大熵模型的应用研究在自然语言处理领域中受到关注 ,文中利用语料库中词性标注的上下文信息建立基于最大熵方法的汉语词性系统。研究的重点在于其特征的选取 ,因为汉语不同于其它语言 ,有其特殊性 ,所以特征的选取上与英语有差别。实验结果证明该模型是有效的 ,词性标注正确率达到 97.34%。
引用
收藏
页码:14 / 16
页数:3
相关论文