学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于异构知识库的命名实体消歧
被引:9
作者
:
论文数:
引用数:
h-index:
机构:
宁博
[
1
]
论文数:
引用数:
h-index:
机构:
张菲菲
[
2
]
机构
:
[1]
西安邮电大学国有资产管理处
[2]
西安邮电大学计算机学院
来源
:
西安邮电大学学报
|
2014年
/ 19卷
/ 04期
关键词
:
人名消歧;
维基百科;
中文信息抽取;
层次聚类;
实体信息;
D O I
:
10.13682/j.issn.2095-6533.2014.04.014
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
081203 ;
0835 ;
摘要
:
针对自然语言处理中的中文命名实体消歧问题,提出一种基于异构知识库的层次聚类方法。利用中文信息抽取系统对中文维基百科等知识库进行抽取,形成包含人物信息、实体关系的实体信息对象,并在Hadoop平台上用分布式计算进行层次聚类,研究人物实体特征的选取和维基百科等知识库的使用对命名实体消歧结果的影响。结果表明加入百科知识库后,F值从91.33%增加到了92.68%。
引用
收藏
页码:70 / 76
页数:7
相关论文
共 6 条
[1]
大数据发展现状及面临的问题
[J].
李芬
论文数:
0
引用数:
0
h-index:
0
机构:
西安邮电大学通信技术研究所
李芬
;
朱志祥
论文数:
0
引用数:
0
h-index:
0
机构:
西安邮电大学通信技术研究所
朱志祥
;
刘盛辉
论文数:
0
引用数:
0
h-index:
0
机构:
西安邮电大学通信技术研究所
刘盛辉
.
西安邮电大学学报,
2013,
18
(05)
:100
-103
[2]
一种基于云计算的网络流量分析系统结构
[J].
论文数:
引用数:
h-index:
机构:
孙韩林
.
西安邮电大学学报,
2013,
18
(04)
:75
-79
[3]
基于维基百科的语义知识库及其构建方法研究
[J].
张海粟
论文数:
0
引用数:
0
h-index:
0
机构:
解放军理工大学指挥自动化学院计算机系
解放军理工大学指挥自动化学院计算机系
张海粟
;
马大明
论文数:
0
引用数:
0
h-index:
0
机构:
部队
解放军理工大学指挥自动化学院计算机系
马大明
;
邓智龙
论文数:
0
引用数:
0
h-index:
0
机构:
解放军理工大学指挥自动化学院计算机系
解放军理工大学指挥自动化学院计算机系
邓智龙
.
计算机应用研究,
2011,
28
(08)
:2807
-2811
[4]
维基百科研究综述
[J].
论文数:
引用数:
h-index:
机构:
赵飞
;
论文数:
引用数:
h-index:
机构:
周涛
;
论文数:
引用数:
h-index:
机构:
张良
;
论文数:
引用数:
h-index:
机构:
马鸣卉
;
刘金虎
论文数:
0
引用数:
0
h-index:
0
机构:
电子科技大学互联网科学中心
电子科技大学应用数学学院
电子科技大学互联网科学中心
刘金虎
;
论文数:
引用数:
h-index:
机构:
余飞
;
查一龙
论文数:
0
引用数:
0
h-index:
0
机构:
电子科技大学互联网科学中心
电子科技大学国际化软件人才实验班
电子科技大学互联网科学中心
查一龙
;
论文数:
引用数:
h-index:
机构:
李睿琪
.
电子科技大学学报,
2010,
39
(03)
:321
-334
[5]
A machine learning approach to coreference resolution of noun phrases
[J].
Soon, WM
论文数:
0
引用数:
0
h-index:
0
机构:
DSO Natl Labs, Singapore, Singapore
Soon, WM
;
Ng, HT
论文数:
0
引用数:
0
h-index:
0
机构:
DSO Natl Labs, Singapore, Singapore
Ng, HT
;
Lim, DCY
论文数:
0
引用数:
0
h-index:
0
机构:
DSO Natl Labs, Singapore, Singapore
Lim, DCY
.
COMPUTATIONAL LINGUISTICS,
2001,
27
(04)
:521
-544
[6]
A vector space model for automatic indexing[J] . G. Salton,A. Wong,C. S. Yang. Communications of the ACM . 1975 (11)
←
1
→
共 6 条
[1]
大数据发展现状及面临的问题
[J].
李芬
论文数:
0
引用数:
0
h-index:
0
机构:
西安邮电大学通信技术研究所
李芬
;
朱志祥
论文数:
0
引用数:
0
h-index:
0
机构:
西安邮电大学通信技术研究所
朱志祥
;
刘盛辉
论文数:
0
引用数:
0
h-index:
0
机构:
西安邮电大学通信技术研究所
刘盛辉
.
西安邮电大学学报,
2013,
18
(05)
:100
-103
[2]
一种基于云计算的网络流量分析系统结构
[J].
论文数:
引用数:
h-index:
机构:
孙韩林
.
西安邮电大学学报,
2013,
18
(04)
:75
-79
[3]
基于维基百科的语义知识库及其构建方法研究
[J].
张海粟
论文数:
0
引用数:
0
h-index:
0
机构:
解放军理工大学指挥自动化学院计算机系
解放军理工大学指挥自动化学院计算机系
张海粟
;
马大明
论文数:
0
引用数:
0
h-index:
0
机构:
部队
解放军理工大学指挥自动化学院计算机系
马大明
;
邓智龙
论文数:
0
引用数:
0
h-index:
0
机构:
解放军理工大学指挥自动化学院计算机系
解放军理工大学指挥自动化学院计算机系
邓智龙
.
计算机应用研究,
2011,
28
(08)
:2807
-2811
[4]
维基百科研究综述
[J].
论文数:
引用数:
h-index:
机构:
赵飞
;
论文数:
引用数:
h-index:
机构:
周涛
;
论文数:
引用数:
h-index:
机构:
张良
;
论文数:
引用数:
h-index:
机构:
马鸣卉
;
刘金虎
论文数:
0
引用数:
0
h-index:
0
机构:
电子科技大学互联网科学中心
电子科技大学应用数学学院
电子科技大学互联网科学中心
刘金虎
;
论文数:
引用数:
h-index:
机构:
余飞
;
查一龙
论文数:
0
引用数:
0
h-index:
0
机构:
电子科技大学互联网科学中心
电子科技大学国际化软件人才实验班
电子科技大学互联网科学中心
查一龙
;
论文数:
引用数:
h-index:
机构:
李睿琪
.
电子科技大学学报,
2010,
39
(03)
:321
-334
[5]
A machine learning approach to coreference resolution of noun phrases
[J].
Soon, WM
论文数:
0
引用数:
0
h-index:
0
机构:
DSO Natl Labs, Singapore, Singapore
Soon, WM
;
Ng, HT
论文数:
0
引用数:
0
h-index:
0
机构:
DSO Natl Labs, Singapore, Singapore
Ng, HT
;
Lim, DCY
论文数:
0
引用数:
0
h-index:
0
机构:
DSO Natl Labs, Singapore, Singapore
Lim, DCY
.
COMPUTATIONAL LINGUISTICS,
2001,
27
(04)
:521
-544
[6]
A vector space model for automatic indexing[J] . G. Salton,A. Wong,C. S. Yang. Communications of the ACM . 1975 (11)
←
1
→