一种基于规则的无监督词性标注方法

被引:5
作者
彭涛 [1 ]
戴耀康 [1 ]
朱枫彤 [1 ]
张邦佐 [2 ]
刘露 [1 ]
闫昭 [1 ]
钱锋 [1 ]
机构
[1] 吉林大学计算机科学与技术学院
[2] 东北师范大学计算机科学与信息技术学院
关键词
词性标注; 基于规则; 无监督学习; 规则函数;
D O I
10.13413/j.cnki.jdxblxb.2015.05.25
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
提出一种基于规则的无监督词性标注方法,利用200多条英语语法规则,创建26个规则函数,先将输入的待标注英语句子进行预处理后得到初始标记,再对每个单词调用规则函数,最终得到标注后的英语句子.通过对Brown语料库的实验,词性标注的正确率达到93.95%.实验结果表明,本文方法可行、有效,能很好地提高英语词性标注的准确率.
引用
收藏
页码:956 / 962
页数:7
相关论文
共 1 条
  • [1] Stochastic approach to the grammatical coding of english[J] . Walter S. Stolz,Percy H. Tannenbaum,Frederick V. Carstensen.Communications of the ACM . 1965 (6)