基于双层随机游走的关系推理算法

被引:13
作者
刘峤
韩明皓
江浏祎
刘瑶
耿技
机构
[1] 电子科技大学信息与软件工程学院
基金
国家自然科学基金重点项目;
关键词
关系推理; 统计关系学习; 知识库扩容; 随机游走; 路径排序算法; 人工智能;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
关系推理是知识库构建的关键技术之一,典型应用场景包括关系预测和实体链接等.关系推理研究的问题是如何利用知识库中已有的知识推理得到新的知识.当前主流知识库采用的推理模型包括潜在因子模型和随机游走模型.前者将实体和关系映射到一个低维实数向量空间,通过向量相似度计算实现推理.后者基于一阶谓词逻辑进行实体间的关系推理,通过随机算法降低算法复杂度.比较而言,前者由于需要进行大规模矩阵运算而计算复杂度较高,后者则因为采用了随机采样方法,难以完全利用知识库中已有的结构化信息,而导致召回率较低.通过研究现有随机游走模型基本假设存在的问题,提出了两项新的推理建模假设.首先,以PRA为代表的随机游走模型采用关系单向性假设,将知识库中的实体关系三元组视为一阶Horn子句,将关系处理为主语和宾语间的偏序关系,该文提出的假设是,尽管实体间的关系从字面和句法上具有方向性,但关系所包含的信息对两侧实体而言具有语义上的双向性,允许关系推理算法利用从宾语到主语的逆向关系语义进行知识推理;其次,PRA算法采用一阶谓词逻辑进行推理,并通过引入一个随机采样机制来避免穷举搜索和提高计算速度,该文认为这是导致PRA算法及类似算法无法完全利用知识库中已有信息的一个主要原因,据此提出了一个新的假设,即知识库中特定关系子网的拓扑结构所包含的信息可以被利用来改善随机游走模型的关系推理结果,为验证上述假设的有效性,提出了一种基于双层随机游走策略的关系推理新算法,在WN18、FB15K和FB40K等公开数据集上的实验结果表明,该算法能够有效地提高基于随机游走的关系推理模型的准确性和召回率,性能显著优于当前主流的基于潜在因子模型的关系推理算法.
引用
收藏
页码:1275 / 1290
页数:16
相关论文
共 5 条
  • [1] 基于开放网络知识的信息检索与数据挖掘
    王元卓
    贾岩涛
    刘大伟
    靳小龙
    程学旗
    [J]. 计算机研究与发展, 2015, (02) : 456 - 474
  • [2] Markov logic networks[J] . Matthew Richardson,Pedro Domingos. &nbspMachine Learning . 2006 (1)
  • [3] Relational retrieval using a combination of path-constrained random walks
    Lao, Ni
    Cohen, William W.
    [J]. MACHINE LEARNING, 2010, 81 (01) : 53 - 67
  • [4] 基于混合推理的知识库的构建及其应用研究
    钟秀琴
    刘忠
    丁盘苹
    [J]. 计算机学报, 2012, 35 (04) : 761 - 766
  • [5] YARM:基于MapReduce的高效可扩展的语义推理引擎
    顾荣
    王芳芳
    袁春风
    黄宜华
    [J]. 计算机学报, 2015, 38 (01) : 74 - 85