基于条件随机域的词性标注模型

被引:11
作者
姜维
关毅
王晓龙
机构
[1] 哈尔滨工业大学计算机科学与技术学院
关键词
词性标注; 条件随机域; 触发对;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
词性标注主要面临兼类词消歧以及未知词标注的难题,传统隐马尔科夫方法不易融合新特征,而最大熵马尔科夫模型存在标注偏置等问题。论文引入条件随机域建立词性标注模型,易于融合新的特征,并能解决标注偏置的问题。此外,又引入长距离特征有效地标注复杂兼类词,以及应用后缀词与命名实体识别等方法提高未知词的标注精度。在条件随机域模型框架下,进一步探讨了融合模型的方法及性能。词性标注开放实验表明,条件随机域模型获得了96.10%的标注精度。
引用
收藏
页码:13 / 16+42 +42
页数:5
相关论文
共 6 条
[1]   融合聚类触发对特征的最大熵词性标注模型 [J].
赵岩 ;
王晓龙 ;
刘秉权 ;
关毅 .
计算机研究与发展, 2006, (02) :268-274
[2]   汉语自动分词和词性标注评测 [J].
杨尔弘 ;
方莹 ;
刘冬明 ;
乔羽 .
中文信息学报, 2006, (01) :44-49+97
[3]   汉语语料词性标注自动校对方法的研究 [J].
钱揖丽 ;
郑家恒 .
中文信息学报, 2004, (02) :30-35
[4]   词性标注中生词处理算法研究 [J].
张孝飞 ;
陈肇雄 ;
黄河燕 ;
蔡智 .
中文信息学报, 2003, (05) :1-5
[5]   基于特征的汉语词性标注模型 [J].
屈刚 ;
陆汝占 .
计算机研究与发展, 2003, (04) :556-561
[6]   基于隐马尔可夫模型(HMM)的词性标注的应用研究 [J].
胡春静 ;
韩兆强 .
计算机工程与应用, 2002, (06) :62-64