知识图谱划分算法研究综述

被引:74
作者
王鑫
陈蔚雪
杨雅君
张小旺
冯志勇
机构
[1] 天津大学智能与计算学部
[2] 天津市认知计算与应用重点实验室
基金
国家重点研发计划;
关键词
知识图谱; 图划分; 多级划分; 流划分; 分布式;
D O I
暂无
中图分类号
O157.5 [图论]; TP301.6 [算法理论]; G353.1 [情报资料的分析和研究];
学科分类号
070101 [基础数学]; 080201 [机械制造及其自动化]; 120502 [情报学];
摘要
知识图谱是人工智能的重要基石,因其包含丰富的图结构和属性信息而受到广泛关注.知识图谱可以精确语义描述现实世界中的各种实体及其联系,其中顶点表示实体,边表示实体间的联系.知识图谱划分是大规模知识图谱分布式处理的首要工作,对知识图谱分布式存储、查询、推理和挖掘起基础支撑作用.随着知识图谱数据规模及分布式处理需求的不断增长,如何对其进行划分已成为目前知识图谱研究的热点问题.从知识图谱和图划分的定义出发,系统性地介绍当前知识图谱数据划分的各类算法,包括基本、多级、流式、分布式和其他类型图划分算法.首先,介绍4种基本图划分算法:谱划分算法、几何划分算法、分支定界算法、KL及其衍生算法,这类算法通常用于小规模图数据或作为其他划分算法的一部分;然后,介绍多级图划分算法,这类算法对图粗糙化后进行划分再投射回原始图,根据粗糙化过程分为基于匹配的算法和基于聚合的算法;其次,描述3种流式图划分算法,这类算法将顶点或边加载为序列后进行划分,包括Hash算法、贪心算法、Fennel算法,以及这3种算法的衍生算法;再次,介绍以KaPPa、JA-BE-JA和轻量级重划分为代表的分布式图划分算法及它们的衍生算法;同时,在其他类型图划分算法中,介绍近年来新兴的2种图划分算法:标签传播算法和基于查询负载的算法.通过在合成与真实知识图谱数据集上的丰富实验,比较了5类知识图谱代表性划分算法在划分效果、查询处理与图数据挖掘方面的性能差异,分析实验结果并推广到推理层面,获得了基于实验的知识图谱划分算法性能评价结论.最后,在对已有方法分析和比较的基础上,总结目前知识图谱数据划分面临的主要挑战,提出相应的研究问题,并展望未来的研究方向.
引用
收藏
页码:235 / 260
页数:26
相关论文
共 25 条
[1]
知识图谱数据管理研究综述 [J].
王鑫 ;
邹磊 ;
王朝坤 ;
彭鹏 ;
冯志勇 .
软件学报, 2019, 30 (07) :2139-2174
[2]
基于启发策略的动态平衡图划分算法 [J].
李琪 ;
钟将 ;
李雪 .
计算机研究与发展, 2017, (12) :2851-2857
[3]
一种改进的基于BSP的大图计算模型 [J].
赵翔 ;
李博 ;
商海川 ;
肖卫东 .
计算机学报, 2017, 40 (01) :223-235
[4]
OnFlyP:基于定向边交换的分布式在线大图划分算法 [J].
王志刚 ;
谷峪 ;
鲍玉斌 ;
于戈 .
计算机学报, 2015, 38 (09) :1838-1851
[5]
BSP模型下基于边聚簇的大图划分与迭代处理 [J].
冷芳玲 ;
刘金鹏 ;
王志刚 ;
陈昌宁 ;
鲍玉斌 ;
于戈 ;
邓超 .
计算机研究与发展, 2015, 52 (04) :960-971
[6]
云计算环境下的大规模图数据处理技术 [J].
于戈 ;
谷峪 ;
鲍玉斌 ;
王志刚 .
计算机学报, 2011, 34 (10) :1753-1767
[7]
DBpedia – A large-scale; multilingual knowledge base extracted from Wikipedia.[J].Jens Lehmann;Robert Isele;Max Jakob;Anja Jentzsch;Dimitris Kontokostas;Pablo N. Mendes;Sebastian Hellmann;Mohamed Morsey;Patrick van Kleef;Sören Auer;Christian Bizer.Semantic Web.2015, 2
[8]
Advanced Coarsening Schemes for Graph Partitioning.[J].Ilya Safro;Peter Sanders;Christian Schulz.Journal of Experimental Algorithmics (JEA).2015,
[9]
Wikidata.[J].Denny Vrandečić;Markus Krötzsch.Communications of the ACM.2014, 10
[10]
An exact algorithm for graph partitioning [J].
Hager, William W. ;
Phan, Dzung T. ;
Zhang, Hongchao .
MATHEMATICAL PROGRAMMING, 2013, 137 (1-2) :531-556