基于信息融合标注的实体及关系联合抽取方法

被引:17
作者
马建红
魏字默
陈亚萌
机构
[1] 河北工业大学人工智能与数据科学学院
关键词
信息融合标注; 联合抽取; 序列标注; 重叠关系; BERT;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
针对目前机器学习方法在化学领域的资源实体及关系抽取任务上召回率低以及高度依赖人工特征工程和领域知识的问题,提出一种基于实体信息及关系信息融合标注的联合抽取方法(Information Fusion Tagging-Joint Model, IFT-Joint)。该方法主要从以下两个方面改进:将联合抽取任务转化为序列标注问题,缓解联合抽取中重叠关系的问题;从序列标注的角度出发,提出一种基于BERT(Bidirectional Encoder Representations from Transformers)联合抽取模型。通过多组实验表明,在化学领域实体数据集上,IFT-Joint的召回率可达到75%以上,相比于所提到的其他方法效果提升明显,且具有良好的稳定性。
引用
收藏
页码:159 / 166
页数:8
相关论文
共 4 条
[1]
深度学习实体关系抽取研究综述 [J].
鄂海红 ;
张文静 ;
肖思琪 ;
程瑞 ;
胡莺夕 ;
周筱松 ;
牛佩晴 .
软件学报, 2019, 30 (06) :1793-1818
[2]
基于深度神经网络的中文命名实体识别 [J].
张海楠 ;
伍大勇 ;
刘悦 ;
程学旗 .
中文信息学报, 2017, 31 (04) :28-35
[3]
基于CRF和规则相结合的地理命名实体识别方法 [J].
何炎祥 ;
罗楚威 ;
胡彬尧 .
计算机应用与软件, 2015, 32 (01) :179-185+202
[4]
基于Deep Belief Nets的中文名实体关系抽取 [J].
陈宇 ;
郑德权 ;
赵铁军 .
软件学报, 2012, 23 (10) :2572-2585