基于条件随机场(CRFs)的中文词性标注方法

被引:55
作者
洪铭材
张阔
唐杰
李涓子
机构
[1] 清华大学计算机系知识工程组
关键词
词性标注; 条件随机场; 维特比解码;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
本文提出一种基于CRFs模型的中文词性标注方法。该方法利用CRFs模型能够添加任意特征的优点,在使用词的上下文信息的同时,针对兼类词和未登录词添加了新的统计特征。在《人民日报》1月份语料库上进行的封闭测试和开放测试中,该方法的标注准确率分别为98.56%和96.60%。
引用
收藏
页码:148 / 151+155 +155
页数:5
相关论文
共 2 条