YARM:基于MapReduce的高效可扩展的语义推理引擎

被引:17
作者
顾荣
王芳芳
袁春风
黄宜华
机构
[1] 南京大学计算机软件新技术国家重点实验室
关键词
RDF; RDFS推理; MapReduce; 语义推理; 分布式推理;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TP181 [自动推理、机器学习];
学科分类号
摘要
随着语义网的快速发展,RDF语义数据大量涌现.大规模RDF语义数据推理的一个主要问题是计算量大、完成计算需要消耗很长的时间.显然,传统的单机语义推理引擎难以处理大规模的语义数据.另一方面,现有的基于MapReduce的大规模语义推理引擎,缺乏对算法在分布和并行计算环境下执行效率的优化,使得推理时间仍然较长.此外,现有的推理引擎大多存在可扩展性方面的不足,难以适应大规模语义数据的增长需求.针对现有的语义推理系统在执行效率和可扩展性方面的不足,文中提出了一种基于MapReduce的并行化语义推理算法和引擎YARM.为了实现分布和并行计算环境下的高效推理,YARM做出了以下4点优化:(1)采用合理的数据划分模型和并行化算法,降低计算节点间的通信开销;(2)优化推理规则的执行次序,提升了推理计算速度;(3)设计了简洁的去重策略,避免新增作业处理重复数据;(4)设计实现了一种新的基于MapReduce的并行化推理算法.实验结果表明,在真实数据集和大规模合成数据集上,YARM的执行速度比当前最新的基于MapReduce的推理引擎快10倍左右,同时YARM还表现出更好的数据和系统可扩展性.
引用
收藏
页码:74 / 85
页数:12
相关论文
共 8 条
  • [1] RDF图数据管理的关键技术研究[D]. 吴刚.清华大学. 2008
  • [2] Marvin : Distributed reasoning over large-scale Semantic Web data[J] . Eyal Oren,Spyros Kotoulas,George Anadiotis,Ronny Siebes,Annette ten Teije,Frank van Harmelen.Web Semantics: Science, Services and Agents on the World Wide Web . 2009 (4)
  • [3] Scalable Authoritative OWL Reasoning for the Web
    Hogan, Aidan
    Harth, Andreas
    Polleres, Axel
    [J]. INTERNATIONAL JOURNAL ON SEMANTIC WEB AND INFORMATION SYSTEMS, 2009, 5 (02) : 49 - 90
  • [4] MapReduce[J] . Jeffrey Dean,Sanjay Ghemawat.Communications of the ACM . 2008 (1)
  • [5] Pellet: A practical OWL-DL reasoner[J] . Evren Sirin,Bijan Parsia,Bernardo Cuenca Grau,Aditya Kalyanpur,Yarden Katz.Web Semantics: Science, Services and Agents on the World Wide Web . 2007 (2)
  • [6] LUBM: A benchmark for OWL knowledge base systems[J] . Yuanbo Guo,Zhengxiang Pan,Jeff Heflin.Web Semantics: Science, Services and Agents on the World Wide Web . 2005 (2)
  • [7] Knowledge engineering: Principles and methods[J] . Rudi Studer,V.Richard Benjamins,Dieter Fensel.Data & Knowledge Engineering . 1998 (1)
  • [8] WordNet[J] . George A. Miller.Communications of the ACM . 1995 (11)