基于网络语义标签的多源知识库实体对齐算法

被引:28
作者
王雪鹏
刘康
何世柱
刘树林
张元哲
赵军
机构
[1] 中国科学院自动化研究所模式识别国家重点实验室
关键词
语义标签; 多源知识库; 实体对齐; 异构; 实体歧义;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
知识库是多种自然语言处理任务的重要数据资源,但单一知识库覆盖度低,不同知识库异构性强,不利于数据的共享和集成.因此,多源知识库融合技术的研究有着十分重要的意义.其中,多源知识库实体对齐是多源知识库融合技术中的重要组成部分.在语义万维网发展的推动下,国外开展了很多相关工作,大多适用于英文知识库,对于中文知识库的研究较少.出于对中文知识库融合的研究目的,该文提出了一种基于网络语义标签的多源知识库实体对齐算法.该算法综合利用属性标签、类别标签和非结构化文本关键词,对齐中文百科实体.经实验测试,该算法能够较好地解决多源知识库实体对齐问题,算法在近95%的准确率下,仍能保持近55%的较好的召回率,应用于实际系统中,满足了实际的多源知识库实体对齐应用需求.
引用
收藏
页码:701 / 711
页数:11
相关论文
共 8 条
  • [1] 基于扩展特征向量空间模型的多源数据融合
    陈珂锐
    潘君
    [J]. 山东大学学报(理学版), 2013, 48 (11) : 87 - 92
  • [2] MultiFarm: A benchmark for multilingual ontology matching[J] . Web Semantics: Science, Services and Agents on the World Wide Web . 2012
  • [3] DBpedia - A crystallization point for the Web of Data
    Bizer, Christian
    Lehmann, Jens
    Kobilarov, Georgi
    Auer, Soeren
    Becker, Christian
    Cyganiak, Richard
    Hellmann, Sebastian
    [J]. JOURNAL OF WEB SEMANTICS, 2009, 7 (03): : 154 - 165
  • [4] YAGO: A Large Ontology from Wikipedia and WordNet[J] . Fabian M. Suchanek,Gjergji Kasneci,Gerhard Weikum.Web Semantics: Science, Services and Agents on the World Wide Web . 2008 (3)
  • [5] Random walk with restart: fast solutions and applications[J] . Hanghang Tong,Christos Faloutsos,Jia-Yu Pan.Knowledge and Information Systems . 2008 (3)
  • [6] Semantic integration[J] . Natalya F. Noy.ACM SIGMOD Record . 2004 (4)
  • [7] A vector space model for automatic indexing[J] . G. Salton,A. Wong,C. S. Yang.Communications of the ACM . 1975 (11)
  • [8] Linking and Building Ontologies of Linked Data .2 Rahul Parundekar,Craig A Knoblock,Jose Luis Ambite. The Semantic Web-ISWC . 2010