基于异构知识库的命名实体消歧

被引:9
作者
宁博 [1 ]
张菲菲 [2 ]
机构
[1] 西安邮电大学国有资产管理处
[2] 西安邮电大学计算机学院
关键词
人名消歧; 维基百科; 中文信息抽取; 层次聚类; 实体信息;
D O I
10.13682/j.issn.2095-6533.2014.04.014
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
针对自然语言处理中的中文命名实体消歧问题,提出一种基于异构知识库的层次聚类方法。利用中文信息抽取系统对中文维基百科等知识库进行抽取,形成包含人物信息、实体关系的实体信息对象,并在Hadoop平台上用分布式计算进行层次聚类,研究人物实体特征的选取和维基百科等知识库的使用对命名实体消歧结果的影响。结果表明加入百科知识库后,F值从91.33%增加到了92.68%。
引用
收藏
页码:70 / 76
页数:7
相关论文
共 6 条
[1]   大数据发展现状及面临的问题 [J].
李芬 ;
朱志祥 ;
刘盛辉 .
西安邮电大学学报, 2013, 18 (05) :100-103
[2]   一种基于云计算的网络流量分析系统结构 [J].
孙韩林 .
西安邮电大学学报, 2013, 18 (04) :75-79
[3]   基于维基百科的语义知识库及其构建方法研究 [J].
张海粟 ;
马大明 ;
邓智龙 .
计算机应用研究, 2011, 28 (08) :2807-2811
[4]   维基百科研究综述 [J].
赵飞 ;
周涛 ;
张良 ;
马鸣卉 ;
刘金虎 ;
余飞 ;
查一龙 ;
李睿琪 .
电子科技大学学报, 2010, 39 (03) :321-334
[5]   A machine learning approach to coreference resolution of noun phrases [J].
Soon, WM ;
Ng, HT ;
Lim, DCY .
COMPUTATIONAL LINGUISTICS, 2001, 27 (04) :521-544
[6]  
A vector space model for automatic indexing[J] . G. Salton,A. Wong,C. S. Yang. Communications of the ACM . 1975 (11)