结合实体链接与实体聚类的命名实体消歧

被引:34
作者
谭咏梅
杨雪
机构
[1] 北京邮电大学智能科学与技术中心
关键词
命名实体消歧; 实体链接; 聚类;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TP391.4 [模式识别与装置];
学科分类号
081102 [检测技术与自动化装置]; 120506 [数字人文];
摘要
为了消除文本中命名实体的歧义,提出了一种结合实体链接与实体聚类的命名实体消歧算法,结合2种方法,可弥补单独使用其中一种方法的局限.该算法在背景文本中将待消歧实体指称扩充为全称,使用扩充后的全称在英文维基百科知识库中生成候选实体集合,同时提取多种特征对候选实体集合进行排序,对于知识库中没有对应实体的指称使用聚类消歧.实验结果表明,该算法在KBP2011评测数据上的F值为0.746,在KBP2012评测数据上的F值为0.670.
引用
收藏
页码:36 / 40
页数:5
相关论文
共 4 条
[1]
基于中文维基百科的命名实体消歧方法 [J].
杜婧君 ;
陆蓓 ;
谌志群 .
杭州电子科技大学学报, 2012, 32 (06) :57-60
[2]
开放式文本信息抽取 [J].
赵军 ;
刘康 ;
周光有 ;
蔡黎 .
中文信息学报, 2011, (06) :98-110
[3]
基于维基百科的自动词义消歧方法 [J].
史天艺 ;
李明禄 .
计算机工程, 2009, 35 (18) :62-64+66
[4]
Evaluating Entity Linking with Wikipedia[J] Ben Hachey;Will Radford;Joel Nothman;Matthew Honnibal;James R. Curran Artificial Intelligence 2013,