结合实体描述信息的跨句包关系抽取方法

被引:4
作者
孙新 [1 ]
申长虹 [1 ]
姜景虎 [1 ]
崔家铭 [2 ]
机构
[1] 北京理工大学计算机学院
[2] 复旦大学信息科学与工程学院
基金
国家重点研发计划;
关键词
关系抽取; 实体描述; 跨关系注意力; 跨句包注意力; 远程监督;
D O I
10.19678/j.issn.1000-3428.0058189
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
远程监督关系抽取方法能够大幅减少标注成本,但现有方法忽略了关系间的关联信息和实体背景知识。结合实体描述信息提出一种新的跨句包关系抽取方法。引入分段卷积神经网络进行句编码,解决特征提取的误差传播问题。同时设计跨关系跨句包注意力机制获取关系特征,更好地从远程监督的噪声数据中鉴别有效实例,从而充分利用关系之间丰富的相关信息并降低噪音句子的影响。在此基础上,利用卷积神经网络提取实体描述信息,补充关系抽取任务所需的背景知识,为跨关系跨句包注意力模块提供更好的实体表示。在NYT公共数据集上的实验结果表明,该方法在句子层面抽取任务上的F1值较结合句注意力与实体描述信息的分段卷积方法提高了4%左右,能够有效改善远程监督关系抽取效果。
引用
收藏
页码:68 / 75
页数:8
相关论文
共 2 条
[1]
深度学习实体关系抽取研究综述 [J].
鄂海红 ;
张文静 ;
肖思琪 ;
程瑞 ;
胡莺夕 ;
周筱松 ;
牛佩晴 .
软件学报, 2019, 30 (06) :1793-1818
[2]
基于深度学习的中文实体关系抽取方法 [J].
孙紫阳 ;
顾君忠 ;
杨静 .
计算机工程, 2018, 44 (09) :164-170