规则与统计相结合的兼类词处理机制

被引:6
作者
黄德根
张丽静
张艳丽
杨元生
机构
[1] 大连理工大学计算机系
[2] 大连理工大学计算机系 辽宁大连
[3] 辽宁大连
关键词
词性标注; 兼类词; 规则; n-元模型;
D O I
暂无
中图分类号
TP391.12 [];
学科分类号
081203 ; 0835 ;
摘要
兼类词处理是词性标注的关键所在 ,本文对兼类词排岐进行了研究 ,介绍了规则和统计相结合的排岐策略 .按照上述策略 ,实现了一个兼类词处理系统 .实验测试结果表明 ,利用规则与统计相结合的兼类词处理机制可以有效地提高排岐正确率和词性标注正确率 ,在封闭测试和开放测试中兼类词的排歧正确率分别达到了 93.91%和 91.16 % ,标注正确率分别达到了 97.85 %和 96 .71% .
引用
收藏
页码:1252 / 1255
页数:4
相关论文
共 5 条
[1]   汉语词性标注排歧方法探讨 [J].
王素格 ;
张永奎 ;
不详 .
计算机工程与应用 , 2001, (07) :70-72
[2]   汉语词性标注方法的研究 [J].
魏欧 ;
孙玉芳 .
计算机科学, 2000, (07) :71-75
[3]   基于统计的汉语词性标注方法的分析与改进 [J].
魏欧 ;
吴健 ;
孙玉芳 ;
sonata.iscas.ac.cn .
软件学报, 2000, (04) :473-480
[4]   规则和统计相结合的汉语词类标注方法 [J].
周强 .
中文信息学报, 1995, (03) :1-10
[5]  
中文文本自动分词和标注[M]. 商务印书馆 , 刘开瑛著, 2000