基于中文维基百科的命名实体消歧方法

被引:10
作者
杜婧君
陆蓓
谌志群
机构
[1] 杭州电子科技大学计算机学院
关键词
命名实体消歧; 词义消歧; 中文维基百科; 中文信息处理;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
该文提出一种面向中文命名实体的统计消歧方法。该方法采用中文维基百科作为世界知识,同时以待消歧命名实体在维基百科中的消歧页包含的词义选项为候选的命名实体概念,在充分利用维基百科页面信息和链接信息,以及命名实体上下文信息的基础上,实现中文命名实体的消歧。在一个小规模测试集上进行了实验,并获得87.5%的准确率,表明提出的方法具有可行性和有效性。
引用
收藏
页码:57 / 60
页数:4
相关论文
共 2 条
[1]
命名实体识别、排歧和跨语言关联 [J].
赵军 .
中文信息学报, 2009, 23 (02) :3-17
[2]
Mining meaning from Wikipedia [J].
Medelyan, Olena ;
Milne, David ;
Legg, Catherine ;
Witten, Ian H. .
INTERNATIONAL JOURNAL OF HUMAN-COMPUTER STUDIES, 2009, 67 (09) :716-754