基于维基类百科知识资源的实体关系发现和语标注

被引:2
作者
程童凌
李娟子
机构
[1] 北京化工大学计算机科学与技术系
关键词
维基类百科; 链接数据; 实体链接;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
互联网Web2.0技术的不断发展促进了以"用户制造"为中心的新一代网络出版载体的发展,维基类百科全书也应运而生。从维基类百科出现开始,维基类百科崇尚自由、开放、共享的精神受到互联网用户的关注。时至今日,维基类百科已经成为了最具活力、影响力最大、传播效力最广的网络出版类型之一。例如维基百科,百度百科,互动百科。维基类百科自身数据间的关系链接为语义网应用服务的发展提供了可能。然而维基类百科编辑者们在编辑词条时并未对一些实体提供语义标注,这导致维基类百科数据间实体关系链接的缺失。本文在前人实体链接技术的基础上,提出了针对百度百科等中文知识百科自动化建立实体链接的方法并建立可信赖的链接。首先识别信息框和正文中的所有实体,然后为每一个实体建立候选匹配表,之后计算一系列的特征值,并通过机器学习方法确定特征值之间的权重,最终选出最佳匹配,建立链接。本文选取百度百科作为数据源,实验结果证明本文的方法可以高效地发现缺失的关系,准确率和召回率都明显优于其他中文百科链接方法
引用
收藏
页码:170 / 173
页数:4
相关论文
共 12 条
[1]  
Cross lingual entity linking with bilingual topic model. T.Zhang,K.Liu,J.Zhao. Proc.Int.Joint Conf.Artif.Intell . 2013
[2]  
Web-scale information extraction in knowitall (preliminary results). O.Etzioni,M.Cafarella,D.Downey,et al. Proc.13th Int.Conf.World Wide Web . 2004
[3]  
Fine-grained entity recognition. X.Ling,D.S.Weld. Proc.26th Conf.Artif.Intell . 2012
[4]  
Yago:A core ofsemantic knowledge unifying wordnet and Wikipedia. F.M.Suchanek,G.Kasneci,G.Weikum. Proc.16th Int.Conf.World Wide Web . 2007
[5]  
Freebase:A collaboratively created graph database for structuring human knowledge. Bollacker K D,Evans C,Paritosh P, et al. SIGMOD Conference . 2008
[6]  
Entity Linking with a Knowledge Base:Issues,Techniques,and Solutions. Wei Shen,Jianyong Wang,Senior Member,et al. IEEE Transactions on Knowledge and Data Engineering . 2015
[7]  
Discovering relations a- mong named entities from large corpora. T Hasegawa,S Sekine,R Grishman. Meeting of the Association for Computational Linguistics . 2004
[8]  
Named entity recognition with character-level models. D.Klein,J.Smarr,H.Nguyen,C.D.Manning. Proc.7th Conf.Natural Language Learning HLT-NAACL . 2003
[9]  
Discovering Missing Semantic Relations Between Entities in Wikipedia. Mengling Xu,Zhichun Wang,RongfangBie,et al. ISWC . 2013
[10]  
Unsupervised personalname disambiguation. G.S.Mann,D.Yarowsky. Proc.7th Conf.Natural Language Learn HLTNAACL . 2003