基于依存树距离识别论元的语义角色标注系统

被引:12
作者
王鑫
穗志方
机构
[1] 北京大学计算语言学研究所
关键词
论元识别; 基于依存树距离的方法; 语义角色标注;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
在基于依存的语义角色标注研究中,大多数系统采用机器学习方法进行论元识别和分类。该文分析了依存树的特点,发现论元集中分布于依存树上的特定局部范围内,因此提出一种基于依存树距离的论元识别方法。该方法将候选论元限制在与目标动词的依存树距离不超过3的范围内,通过制订规则,提取目标动词的最佳候选论元集合。在CoNLL2009中文语料上采用正确的依存树,识别出了98.5%的论元。在此基础上,结合基于机器学习的角色分类,系统F值达到89.46%,比前人的方法 (81.68%)有了较为显著的提升。
引用
收藏
页码:40 / 45
页数:6
相关论文
共 5 条
[1]
基于两种句法分析的语义角色标注比较研究 [J].
张育 ;
王红玲 ;
周国栋 .
计算机应用与软件, 2010, 27 (08) :13-16
[2]
基于依存句法分析的中文语义角色标注 [J].
王步康 ;
王红玲 ;
袁晓虹 ;
周国栋 .
中文信息学报, 2010, (01) :25-29+47
[3]
语义角色标注中有效的识别论元算法研究 [J].
丁金涛 ;
周国栋 ;
王红玲 ;
朱巧明 .
计算机工程与应用 , 2008, (18) :153-156
[4]
汉语配价语法论略[J] 周国光 南京师大学报(社会科学版) 1994, 04
[5]
Trust region Newton method for large-scale logisticregression Chih-Jen Lin;Ruby C Weng;S.Sathiya Keerthi; Proceedings of the 24th InternationalConference on Machine Learning 2007,