学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于维基百科的中文短文本分类研究
被引:32
作者
:
论文数:
引用数:
h-index:
机构:
范云杰
刘怀亮
论文数:
0
引用数:
0
h-index:
0
机构:
西安电子科技大学经济管理学院
刘怀亮
机构
:
[1]
西安电子科技大学经济管理学院
来源
:
现代图书情报技术
|
2012年
/ 03期
关键词
:
短文本;
维基百科;
文本分类;
特征扩展;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
摘要
:
针对中文短文本自身词汇个数少、描述信息弱的缺陷,引入特征扩展的方法辅助分类。借助网络知识库维基百科抽取相关概念,并采用统计规律与类别信息相结合的方式计算概念间相关度,建立语义相关概念集合,对短文本的特征向量进行扩展,从而有效补充短文本的语义特征。对比实验表明,基于维基百科的短文本分类方法能够提高短文本分类的效果。
引用
收藏
页码:47 / 52
页数:6
相关论文
共 9 条
[1]
基于维基百科的语义知识库及其构建方法研究
张海粟
论文数:
0
引用数:
0
h-index:
0
机构:
解放军理工大学指挥自动化学院计算机系
解放军理工大学指挥自动化学院计算机系
张海粟
马大明
论文数:
0
引用数:
0
h-index:
0
机构:
部队
解放军理工大学指挥自动化学院计算机系
马大明
邓智龙
论文数:
0
引用数:
0
h-index:
0
机构:
解放军理工大学指挥自动化学院计算机系
解放军理工大学指挥自动化学院计算机系
邓智龙
[J].
计算机应用研究,
2011,
28
(08)
: 2807
-
2811
[2]
基于维基百科的语义相似度计算方法
论文数:
引用数:
h-index:
机构:
盛志超
陶晓鹏
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学计算机科学技术学院
陶晓鹏
[J].
计算机工程,
2011,
37
(07)
: 193
-
195
[3]
中文短文本分类方法研究
王细薇
论文数:
0
引用数:
0
h-index:
0
机构:
河南城建学院信息中心
王细薇
沈云琴
论文数:
0
引用数:
0
h-index:
0
机构:
河南城建学院信息中心
沈云琴
[J].
现代计算机(专业版),
2010,
(07)
: 28
-
31
[4]
利用上下位关系的中文短文本分类
论文数:
引用数:
h-index:
机构:
王盛
樊兴华
论文数:
0
引用数:
0
h-index:
0
机构:
重庆邮电大学计算机科学与技术研究所
樊兴华
论文数:
引用数:
h-index:
机构:
陈现麟
[J].
计算机应用,
2010,
30
(03)
: 603
-
606+611
[5]
中文文本分类中利用依存关系的实验研究
王鹏
论文数:
0
引用数:
0
h-index:
0
机构:
重庆邮电大学计算机科学与技术研究所
王鹏
樊兴华
论文数:
0
引用数:
0
h-index:
0
机构:
重庆邮电大学计算机科学与技术研究所
樊兴华
[J].
计算机工程与应用,
2010,
46
(03)
: 131
-
133+141
[6]
基于领域词语本体的短文本分类
论文数:
引用数:
h-index:
机构:
宁亚辉
樊兴华
论文数:
0
引用数:
0
h-index:
0
机构:
重庆邮电大学计算机科学与技术研究所
樊兴华
吴渝
论文数:
0
引用数:
0
h-index:
0
机构:
重庆邮电大学计算机科学与技术研究所
吴渝
[J].
计算机科学,
2009,
36
(03)
: 142
-
145
[7]
基于关联规则挖掘的中文文本自动分类
王元珍
论文数:
0
引用数:
0
h-index:
0
机构:
华中科技大学计算机学院数据库与多媒体技术研究所
王元珍
论文数:
引用数:
h-index:
机构:
钱铁云
冯小年
论文数:
0
引用数:
0
h-index:
0
机构:
华中科技大学计算机学院数据库与多媒体技术研究所
冯小年
[J].
小型微型计算机系统,
2005,
(08)
: 1380
-
1383
[8]
异质知识网络相关度算法研究[J]. 裘江南,秦璇,仲秋雁.情报学报. 2011 (05)
[9]
基于维基百科构建语义知识库及其在文本分类领域的应用研究[D]. 苏小康.华中师范大学. 2010
←
1
→
共 9 条
[1]
基于维基百科的语义知识库及其构建方法研究
张海粟
论文数:
0
引用数:
0
h-index:
0
机构:
解放军理工大学指挥自动化学院计算机系
解放军理工大学指挥自动化学院计算机系
张海粟
马大明
论文数:
0
引用数:
0
h-index:
0
机构:
部队
解放军理工大学指挥自动化学院计算机系
马大明
邓智龙
论文数:
0
引用数:
0
h-index:
0
机构:
解放军理工大学指挥自动化学院计算机系
解放军理工大学指挥自动化学院计算机系
邓智龙
[J].
计算机应用研究,
2011,
28
(08)
: 2807
-
2811
[2]
基于维基百科的语义相似度计算方法
论文数:
引用数:
h-index:
机构:
盛志超
陶晓鹏
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学计算机科学技术学院
陶晓鹏
[J].
计算机工程,
2011,
37
(07)
: 193
-
195
[3]
中文短文本分类方法研究
王细薇
论文数:
0
引用数:
0
h-index:
0
机构:
河南城建学院信息中心
王细薇
沈云琴
论文数:
0
引用数:
0
h-index:
0
机构:
河南城建学院信息中心
沈云琴
[J].
现代计算机(专业版),
2010,
(07)
: 28
-
31
[4]
利用上下位关系的中文短文本分类
论文数:
引用数:
h-index:
机构:
王盛
樊兴华
论文数:
0
引用数:
0
h-index:
0
机构:
重庆邮电大学计算机科学与技术研究所
樊兴华
论文数:
引用数:
h-index:
机构:
陈现麟
[J].
计算机应用,
2010,
30
(03)
: 603
-
606+611
[5]
中文文本分类中利用依存关系的实验研究
王鹏
论文数:
0
引用数:
0
h-index:
0
机构:
重庆邮电大学计算机科学与技术研究所
王鹏
樊兴华
论文数:
0
引用数:
0
h-index:
0
机构:
重庆邮电大学计算机科学与技术研究所
樊兴华
[J].
计算机工程与应用,
2010,
46
(03)
: 131
-
133+141
[6]
基于领域词语本体的短文本分类
论文数:
引用数:
h-index:
机构:
宁亚辉
樊兴华
论文数:
0
引用数:
0
h-index:
0
机构:
重庆邮电大学计算机科学与技术研究所
樊兴华
吴渝
论文数:
0
引用数:
0
h-index:
0
机构:
重庆邮电大学计算机科学与技术研究所
吴渝
[J].
计算机科学,
2009,
36
(03)
: 142
-
145
[7]
基于关联规则挖掘的中文文本自动分类
王元珍
论文数:
0
引用数:
0
h-index:
0
机构:
华中科技大学计算机学院数据库与多媒体技术研究所
王元珍
论文数:
引用数:
h-index:
机构:
钱铁云
冯小年
论文数:
0
引用数:
0
h-index:
0
机构:
华中科技大学计算机学院数据库与多媒体技术研究所
冯小年
[J].
小型微型计算机系统,
2005,
(08)
: 1380
-
1383
[8]
异质知识网络相关度算法研究[J]. 裘江南,秦璇,仲秋雁.情报学报. 2011 (05)
[9]
基于维基百科构建语义知识库及其在文本分类领域的应用研究[D]. 苏小康.华中师范大学. 2010
←
1
→