知识库实体对齐技术综述

被引:91
作者
庄严
李国良
冯建华
机构
[1] 清华大学计算机科学与技术系
关键词
知识库; 实体对齐; 相似性传播; 概率模型; 相似性函数; 分区索引;
D O I
暂无
中图分类号
TP182 [专家系统、知识工程];
学科分类号
1111 ;
摘要
知识库的实体对齐(entity alignment)工作是近年来的研究热点问题.知识库实体对齐的目标是能够高质量链接多个现有知识库,并从顶层创建一个大规模的统一的知识库,从而帮助机器理解底层数据.然而,知识库实体对齐在数据质量、匹配效率等多个方面存在很多问题与挑战有待解决.从这些挑战出发,对十几年来的可用于知识库实体对齐的技术和算法进行综述,通过分类和总结现有技术,为进一步的研究工作提供可选方案.首先形式化定义了知识库实体对齐问题;然后对知识库的实体对齐工作进行总体概述,并从对齐算法、特征匹配技术和分区索引技术3个方面详细总结了各种可用方法和研究进展,重点从局部和全局2个角度对主流的集体对齐算法进行详细阐述,并介绍了常用的评测数据集;最后对未来重点的研究内容和发展方向进行了探讨和展望.
引用
收藏
页码:165 / 192
页数:28
相关论文
共 24 条
  • [1] 基于开放网络知识的信息检索与数据挖掘
    王元卓
    贾岩涛
    刘大伟
    靳小龙
    程学旗
    [J]. 计算机研究与发展, 2015, 52 (02) : 456 - 474
  • [2] 语义Web中对象共指的消解研究
    胡伟
    柏文阳
    瞿裕忠
    [J]. 软件学报, 2012, 23 (07) : 1729 - 1744
  • [3] 马尔可夫逻辑网络研究
    徐从富
    郝春亮
    苏保君
    楼俊杰
    [J]. 软件学报, 2011, 22 (08) : 1699 - 1713
  • [4] 命名实体识别、排歧和跨语言关联
    赵军
    [J]. 中文信息学报, 2009, (02) : 3 - 17
  • [5] 指代消解的基本方法和实现技术
    王厚峰
    [J]. 中文信息学报, 2002, (06) : 9 - 17
  • [6] Ontology matching: A literature review[J] . Lorena Otero-Cerdeira,Francisco J. Rodríguez-Martínez,Alma Gómez-Rodríguez.Expert Systems With Applications . 2015 (2)
  • [7] Large-scale linked data integration using probabilistic reasoning and crowdsourcing[J] . Gianluca Demartini,Djellel Eddine Difallah,Philippe Cudré-Mauroux.The VLDB Journal . 2013 (5)
  • [8] Large scale instance matching via multiple indexes and candidate selection[J] . Juanzi Li,Zhichun Wang,Xiao Zhang,Jie Tang.Knowledge-Based Systems . 2013
  • [9] Development and user experiences of an open source data cleaning, deduplication and record linkage system[J] . Peter Christen.ACM SIGKDD Explorations Newsletter . 2009 (1)
  • [10] Linked Data - The Story So Far
    Bizer, Christian
    Heath, Tom
    Berners-Lee, Tim
    [J]. INTERNATIONAL JOURNAL ON SEMANTIC WEB AND INFORMATION SYSTEMS, 2009, 5 (03) : 1 - 22