中文实体关系抽取中的特征选择研究

被引:170
作者
董静
孙乐
冯元勇
黄瑞红
机构
[1] 中国科学院软件研究所中文信息处理中心
关键词
计算机应用; 中文信息处理; 实体关系抽取; 包含关系; 非包含关系; 特征选择; ACE评测;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
命名实体关系抽取是信息抽取研究领域中的重要研究课题之一。通过分析,本文提出将中文实体关系划分为:包含实体关系与非包含实体关系。针对同一种句法特征在识别它们时性能的明显差异,本文对这两种关系采用了不同的句法特征集,并提出了一些适合各自特点的新的句法特征。在CRF模型框架下,以ACE2007的语料作为实验数据,结果表明本文的划分方法和新特征有效的提高了汉语实体关系抽取任务的性能。
引用
收藏
页码:80 / 85+91 +91
页数:7
相关论文
共 2 条
[1]
基于事件框架的信息抽取系统 [J].
梁晗 ;
陈群秀 ;
吴平博 .
中文信息学报, 2006, (02) :40-46
[2]
实体关系自动抽取 [J].
车万翔 ;
刘挺 ;
李生 .
中文信息学报, 2005, (02) :1-6