一种面向中文本体模式的本体对齐框架

被引:4
作者
王汀 [1 ]
高迎 [1 ]
刘经纬 [1 ]
机构
[1] 首都经济贸易大学信息学院
关键词
中文关联数据; 同义词词林; 序列比对; 本体映射; 相似度计算;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
【目的】现有的本体对齐方法往往忽视中文概念的语序敏感和一词多义的语义特征。本文提出一种基于同义词词林和序列比对算法的大规模中文本体映射模型。【方法】采用基于改进的同义词词林相似度算法计算简单词元的语义相似度。并利用基于改进同义词词林与序列比对相融合的算法度量未登录词之间的语义相似度。【结果】在由DBpedia(中文版)、百度百科和互动百科知识库所构建的测试语料上的关联映射实验结果表明,该模型的准确率、召回率和综合评价指标平均分别达到约97.5%、87.8%和92.1%。【局限】本模型仅专注于对中文本体概念的元素级相似度度量,并未考虑本体属性和实例对于概念等价关系的影响因素。【结论】在面向中文网络百科的大规模开放语义数据集上的评测结果证明,该模型的总体性能明显优于现有算法。
引用
收藏
页码:47 / 57
页数:11
相关论文
共 31 条
  • [1] A general method applicable to the search for similarities in the amino acid sequence of two proteins. Needleman SB,Wunsch CD. Journal of Molecular Biology . 1970
  • [2] Hudong. http://www.hudong.com/ . 2015
  • [3] A declarative framework for semantic link discovery over relational data. Hassanzadeh O,Lim L,Kementsietsidis A,et al. Proceedings of the 18th International Conference on World Wide Web . 2009
  • [4] 知网的理论发现
    董振东
    董强
    郝长伶
    [J]. 中文信息学报, 2007, (04) : 3 - 9
  • [5] An empirical study of instance-based ontology matching. Isaac A,Van Der Meij L,Schlobach S, et al. The Semantic Web . 2007
  • [6] Boosting Cross-Lingual Knowledge Linking via Concept Annotation. Wang Z,Li J,Tang J. Proceedings of the International Joint Conference on Artificial Intelligent . 2013
  • [7] The Semantic Web. Berners-Lee T,Hendler J,Lassila O. Scientific American . 2001
  • [8] Ontology alignment for linked open data. Jain P,Hitzler P,Sheth A, et al. The Semantic Web-ISWC 2010 . 2010
  • [9] 中文本体映射研究与实现
    李佳
    祝铭
    刘辰
    杨正球
    [J]. 中文信息学报, 2007, (04) : 27 - 33
  • [10] Binary Codes Capable of Correcting Deletions, Insertions and Reversals. Levenshtein VI. Soviet Physics-Doklady . 1966