实体对齐研究综述

被引:96
作者
张富
杨琳艳
李健伟
程经纬
机构
[1] 东北大学计算机科学与工程学院
关键词
知识图谱; 实体对齐; 知识图谱融合; 知识表示学习; 多源信息;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
实体对齐(Entity Alignment)旨在发现不同知识图谱(Knowledge Graph)中指代相同事物的实体,是知识图谱融合的关键技术,近年来受到了广泛的关注.早期,研究者们使用字符串的各种特征来进行实体对齐工作.近年来,随着知识表示学习(Knowledge Representation Learning)技术的不断发展,研究者们提出了许多基于知识表示学习的实体对齐方法,效果明显优于传统方法.然而,实体对齐的研究仍然存在着许多亟待解决的问题与挑战,比如数据质量、计算效率等.本文从实体对齐的定义、数据集和评价指标出发,详细深入地综述和比较了传统实体对齐方法和基于知识表示学习的实体对齐方法.针对传统方法,分类介绍了基于相似性计算和基于关系推理的实体对齐方法,并深入研究了每类方法对字符特征、属性特征、关系特征的利用,同时深入分析了不同方法之间的优势与不足.针对基于知识表示学习的实体对齐方法,本文进行了重点讨论、分析和对比.首先,本文将该类实体对齐方法抽象为由三个模块(即嵌入模块、交互模块和对齐模块)组成的统一框架,依据三个模块对每个方法进行了详细的综述.进一步地,根据方法所利用的信息种类的不同,将已有方法划分为基于结构信息、属性信息、实体名信息、实体描述信息和综合信息等八类方法,对每一类方法进行了详细的综述.然后,对基于知识表示学习的实体对齐方法进行了深入对比分析.最后,讨论了实体对齐工作的主要挑战,包括稀疏知识图谱的处理、标注数据的缺乏和噪声问题、方法的效率问题等,并对该工作的未来进行了展望.
引用
收藏
页码:1195 / 1225
页数:31
相关论文
共 32 条
[1]
基于重排序的迭代式实体对齐 [J].
曾维新 ;
赵翔 ;
唐九阳 ;
谭真 ;
王炜 .
计算机研究与发展, 2020, 57 (07) :1460-1471
[2]
多源知识融合技术研究综述 [J].
赵晓娟 ;
贾焰 ;
李爱平 ;
常春喜 .
云南大学学报(自然科学版), 2020, 42 (03) :459-473
[3]
基于图神经网络的实体对齐研究综述 [J].
孟鹏博 .
现代计算机, 2020, (09) :37-40
[4]
自适应属性选择的实体对齐方法 [J].
苏佳林 ;
王元卓 ;
靳小龙 ;
程学旗 .
山东大学学报(工学版), 2020, 50 (01) :14-20
[5]
一种基于实体描述和知识向量相似度的跨语言实体对齐模型 [J].
康世泽 ;
吉立新 ;
刘树新 ;
丁悦航 .
电子学报, 2019, 47 (09) :1841-1847
[6]
融合语义和结构信息的知识图谱实体对齐 [J].
苏佳林 ;
王元卓 ;
靳小龙 ;
李曼玲 ;
程学旗 .
山西大学学报(自然科学版), 2019, 42 (01) :23-30
[7]
表示学习知识图谱的实体对齐算法 [J].
朱继召 ;
乔建忠 ;
林树宽 .
东北大学学报(自然科学版), 2018, (11) :1535-1539
[8]
基于网络语义标签的多源知识库实体对齐算法 [J].
王雪鹏 ;
刘康 ;
何世柱 ;
刘树林 ;
张元哲 ;
赵军 .
计算机学报, 2017, 40 (03) :701-711
[9]
知识表示学习研究进展 [J].
刘知远 ;
孙茂松 ;
林衍凯 ;
谢若冰 .
计算机研究与发展, 2016, 53 (02) :247-261
[10]
知识库实体对齐技术综述 [J].
庄严 ;
李国良 ;
冯建华 .
计算机研究与发展, 2016, (01) :165-192