基于语义一致性的集成实体链接算法

被引:20
作者
刘峤
钟云
刘瑶
吴祖峰
秦志光
机构
[1] 电子科技大学信息与软件工程学院
关键词
集成实体链接; 信息抽取; 知识库扩容; 个性化PageRank; 语义相关性;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
实体链接任务的目标是将从文本中抽取得到的实体指称项正确地链接到知识库中的对应实体对象上.当前主流的实体链接算法大致可分为2类:基于上下文相似度的实体链接算法和基于图的集成实体链接算法.这2类算法各自存在一些优点和不足.前者有利于从上下文语义的角度对实体进行区分,但难以充分利用知识库中已有的知识体系辅助决策;后者能够更好地利用知识库中实体间的语义关联关系,但在上下文信息不充分的情况下,较难区分概念相近的实体.提出一种基于语义一致性的集成实体链接算法,该算法能够更好地利用知识库中实体间的结构化语义关系,帮助提高算法对概念相似实体的区分度,实验结果表明:该算法能够有效提高实体链接结果的准确率和召回率,性能显著优于当前的主流算法,在对长、短文本的实体链接任务中性能表现稳定,具有良好的适应性和可推广性.
引用
收藏
页码:1696 / 1708
页数:13
相关论文
共 3 条
[1]
Ease of interaction plus ease of integration: Combining Web2.0 and the Semantic Web in a reviewing site.[J].Tom Heath;Enrico Motta.Web Semantics: Science; Services and Agents on the World Wide Web.2007, 1
[2]
一种基于图模型的维基概念相似度计算方法及其在实体链接系统中的应用 [J].
张涛 ;
刘康 ;
赵军 .
中文信息学报, 2015, (02) :58-67
[3]
一种基于概率主题模型的命名实体链接方法 [J].
怀宝兴 ;
宝腾飞 ;
祝恒书 ;
刘淇 .
软件学报, 2014, 25 (09) :2076-2087