基于句法语义特征的中文实体关系抽取

被引:254
作者
甘丽新
万常选
刘德喜
钟青
江腾蛟
机构
[1] 江西财经大学信息管理学院
[2] 数据与知识工程江西省高校重点实验室(江西财经大学)
关键词
关系抽取; 关系探测; 句法特征; 语义特征; 支持向量机;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
作为语义网络和本体的基础,实体关系抽取已被广泛应用于信息检索、机器翻译和自动问答系统中.实体关系抽取的核心问题在于实体关系特征的选择和提取.中文长句的句式较复杂,经常包含多个实体的特点以及数据稀疏问题,给中文关系探测和关系抽取任务带了挑战.为了解决上述问题,提出了一种基于句法语义特征的实体关系抽取方法.通过将2个实体各自的依存句法关系进行组合,获取依存句法关系组合特征,利用依存句法分析和词性标注选择最近句法依赖动词特征.将这2个新特征加入到基于特征的关系探测和关系抽取中,使用支持向量机(support vector machine,SVM)方法,以真实旅游领域文本作为语料进行实验.实验表明,从句法和语义上提取的2个特征能够有效地提高实体关系探测和关系抽取的性能,其准确率、召回率和F1值均优于已有方法.此外,最近句法依赖动词特征非常有效,尤其对数据稀疏的关系类型贡献最大,在关系探测和关系抽取上的性能均优于当前经典的基于动词特征方法.
引用
收藏
页码:284 / 302
页数:19
相关论文
共 12 条
[1]
基于句法语义特征的中文实体关系抽取 [J].
郭喜跃 ;
何婷婷 ;
胡小华 ;
陈前军 .
中文信息学报, 2014, (06) :183-189
[2]
Event Type Recognition Based on Trigger Expansion[J] 秦兵;赵妍妍;丁效;刘挺;翟国富; Tsinghua Science and Technology 2010, 03
[3]
实体关系抽取的技术方法综述 [J].
徐健 ;
张智雄 ;
吴振新 .
现代图书情报技术, 2008, (08) :18-23
[4]
语言学组合特征在语义关系抽取中的应用 [J].
奚斌 ;
钱龙华 ;
周国栋 ;
朱巧明 ;
钱培德 .
中文信息学报, 2008, (03) :44-49+63
[5]
中文实体关系抽取中的特征选择研究 [J].
董静 ;
孙乐 ;
冯元勇 ;
黄瑞红 .
中文信息学报, 2007, (04) :80-85+91
[6]
实体关系自动抽取 [J].
车万翔 ;
刘挺 ;
李生 .
中文信息学报, 2005, (02) :1-6
[7]
Using compositional semantics and discourse consistency to improve Chinese trigger identification[J] Pei-Feng Li;Qiao-Ming Zhu;Guo-Dong Zhou Information Processing and Management 2014,
[8]
A relation extraction method of Chinese named entities based on location and semantic features[J] Haiguang Li;Xindong Wu;Zhao Li;Gongqing Wu Applied Intelligence 2013,
[9]
Predicting motor vehicle crashes using Support Vector Machine models[J] Xiugang Li;Dominique Lord;Yunlong Zhang;Yuanchang Xie Accident Analysis and Prevention 2008,
[10]
Semi-supervised relation extraction with large-scale word clustering Sun A;Grishman R;Sekine S; Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics 2011,