基于双向标注融合的汉语最长短语识别方法

被引:17
作者
鉴萍
宗成庆
机构
[1] 中国科学院自动化研究所模式识别国家重点实验室
关键词
最长名词短语识别; 介词短语识别; 序列标注; 双向标注; 分歧点;
D O I
暂无
中图分类号
TP391.43 [];
学科分类号
摘要
汉语最长短语(最长名词短语和介词短语)具有显著的语言学特点.采用基于分类器的确定性标注方法进行双向标注,其结果能够显示最长短语识别在汉语句子正(由左至右)反(由右至左)2个方向上的互补性.基于此,利用确定性的双向标注技术来识别汉语最长短语,并提出了一种基于"分歧点"的概率融合策略以融合该双向标注结果.实验表明,这一融合算法能够有效发掘这2个方向的互补特性,从而获得较好的短语识别效果.
引用
收藏
页码:406 / 413
页数:8
相关论文
共 4 条
[1]
基于条件随机域的复杂最长名词短语识别 [J].
冯冲 ;
陈肇雄 ;
黄河燕 ;
张亮 ;
王江伟 .
小型微型计算机系统, 2006, (06) :1134-1139
[2]
汉语介词短语的自动识别 [J].
干俊伟 ;
黄德根 .
中文信息学报, 2005, (04) :17-23
[3]
现代汉语介词短语边界识别研究 [J].
王立霞 ;
孙宏林 .
中文信息学报, 2005, (03) :80-86
[4]
汉语最长名词短语的自动识别 [J].
周强 ;
孙茂松 ;
黄昌宁 .
软件学报, 2000, (02) :195-201