面向金融知识图谱的实体和关系联合抽取算法

被引:23
作者
胡扬 [1 ]
闫宏飞 [1 ,2 ]
陈翀 [3 ]
机构
[1] 北京大学信息科学技术学院
[2] 北京大学大数据科学研究中心大数据分析与应用技术国家工程实验室
[3] 北京师范大学政府管理学院
关键词
命名实体识别; 关系抽取; 联合抽取; 知识图谱;
D O I
暂无
中图分类号
F830 [金融、银行理论]; TP391.1 [文字信息处理];
学科分类号
020219 [财政学(含:税收学)]; 120506 [数字人文];
摘要
在知识图谱的构建过程中,传统方法先进行命名实体识别,再进行关系抽取,导致任务间关联信息的丢失,而且忽略了实体间的重叠关系。为此,基于能识别重叠关系的Bi-LSTM+CRF模型,通过参数共享实现两个任务联合学习,充分利用任务间联系来优化结果。公开数据集上的实验结果表明:所提出模型在实体识别上取得了78. 4%的f1值,在非重叠关系和重叠关系的抽取上取得了50. 5%和45. 0%的f1值。为验证该方法可后续用于金融知识图谱构建,提取了小型金融数据集来验证其在金融数据上的泛化能力。
引用
收藏
页码:139 / 149
页数:11
相关论文
共 1 条
[1]
Long short-term memory [J].
Hochreiter, S ;
Schmidhuber, J .
NEURAL COMPUTATION, 1997, 9 (08) :1735-1780