基于数据场和全局序列比对的大规模中文关联数据模型

被引:4
作者
王汀
徐天晟
冀付军
机构
[1] 首都经济贸易大学信息学院
关键词
语义网; 关联数据; 本体映射; 同义词词林; 相似度计算;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
目前关联数据的研究工作主要集中在实例级别上展开,而在模式级别(Schema-Level)上的关联数据构建则易被忽视。本体映射是解决本体异构问题的重要途径和手段,同时,本体映射也可视为模式级别关联数据构建的典型情景。特别是在中文知识库方面,中文知识是关联数据网中的重要组成部分,但现有的中文本体映射系统在面对大规模本体映射任务时,显得效率较低且可用性不高,目前仍缺乏针对中文大规模本体映射的相关系统。为了解决在模式级别上的中文大规模关联数据构建问题,提出了一种新的基于数据场和序列比对思想的大规模中文关联数据构建模型。首先,基于改进的融合概念相似度和相异度的拟核力场势函数对大规模中文本体映射规模进行约简和压缩;其次,通过引入序列比对算法,对组合概念进行相似度的度量;最后,将本系统与相似度计算相关典型算法进行比较,表明其具备一定的可用性和较高的总体性能。
引用
收藏
页码:204 / 212
页数:9
相关论文
共 20 条
  • [1] Wordnet:An electronic lexical database. Stark M M,Riesenfeld R F. Proceedings of 11th Eurographics workshop on rendering . 1998
  • [2] The Semantic Web. Berners-Lee T,Hendler J,Lassila O. Scientific American . 2001
  • [3] A general method applicable to the search for similarities in the amino acid sequence of two proteins. Needleman SB,Wunsch CD. Journal of Molecular Biology . 1970
  • [4] A Thesaurus and Online Encyclopedia Merging Method for Large Scale Domain-Ontology Automatic Construction. Wang T,Song J C,Di R H,et al. KSEM 2013 . 2013
  • [5] http://ictclas.org/ .
  • [6] http://ir.hit.edu.cn/demo/ltp/Sharing_Plan.htm .
  • [7] Acomparison of stringdistance metrics for name-matching tasks. Cohen W,Ravikumar P,Fienberg S. Proceedings ofthe IJCAI Workshop on Information Integration on the Web(II Web) . 2003
  • [8] Linked data on the Web (LDOW2008). Bizer C,Heath T,Idehen K,et al. Proceeding of the17th International Conference on World Wide Web . 2008
  • [9] A Gauss Function Based Approach for Unbalanced Ontology Matching. Qian Z,Li H,Li J, et al. SIGMOD Record . 2009
  • [10] An empirical studyof instance-based ontology matching. Isaac A,Meij L,Schlobach S,Wang S. Proceedings of the 6thInternational Semantic Web Conference and the 2nd AsianSemantic Web Conference(ISWC/ASWC) . 2007