基于核方法的中文实体关系抽取研究

被引:18
作者
黄瑞红
孙乐
冯元勇
黄云平
机构
[1] 中国科学院软件研究所
关键词
计算机应用; 中文信息处理; 中文实体关系抽取; 核方法; 卷积树核; 复合核; 最短路径依赖核;
D O I
暂无
中图分类号
TP391.41 [];
学科分类号
080203 ;
摘要
命名实体关系抽取是信息抽取领域中的重要研究课题之一。该文探讨了核方法在中文关系抽取上的有效性问题,主要分为三部分:研究了在卷积树核中使用不同的语法树对关系抽取性能的影响;通过构造复合核检查了树核与平面核之间的互补效果;改进了最短路径依赖核,将核计算建立在原最短依赖路径的最长公共子序列上,以消除原始最短路径依赖核对依赖路径长度相同的过严要求。因为核方法开始被用于英文关系抽取时,F1值也只有40%左右,而我们在ACE2007标准语料集上的实验结果表明,只使用作用在语法树上的卷积核时,中文关系抽取的F1值达到了35%,可见卷积核方法对中文关系抽取也是有效的,同时实验也表明最短路径依赖核对中文关系抽取效果不明显。
引用
收藏
页码:102 / 108
页数:7
相关论文
共 3 条
[1]   中文实体关系抽取中的特征选择研究 [J].
董静 ;
孙乐 ;
冯元勇 ;
黄瑞红 .
中文信息学报, 2007, (04) :80-85+91
[2]   实体关系自动抽取 [J].
车万翔 ;
刘挺 ;
李生 .
中文信息学报, 2005, (02) :1-6
[3]  
Message Understanding Conferences(MUC)1987-1998 .