学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于词频信息的改进信息增益文本特征选择算法
被引:14
作者
:
论文数:
引用数:
h-index:
机构:
石慧
[
1
]
论文数:
引用数:
h-index:
机构:
贾代平
[
2
]
论文数:
引用数:
h-index:
机构:
苗培
[
1
]
机构
:
[1]
山东师范大学信息科学与工程学院
[2]
山东工商学院计算机科学与技术学院
来源
:
计算机应用
|
2014年
/ 34卷
/ 11期
关键词
:
文本分类;
特征选择;
信息增益;
词频;
参数修正;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
摘要
:
为克服传统信息增益(IG)算法对特征项的频数考虑不足的缺陷,在对传统算法和相关改进算法深入分析的基础上,提出一种基于词频信息的改进的IG文本特征选择算法。分别从特征项在类内出现的频数、类内位置分布、不同类间的分布等方面对传统IG算法的参数进行了修正,使特征频数信息得到充分利用。对文本分类的实验结果表明,所提算法的分类精度明显高于传统IG算法和加权的IG改进算法。
引用
收藏
页码:3279 / 3282
页数:4
相关论文
共 8 条
[1]
基于信息增益特征关联树的文本特征选择算法
[J].
任永功
论文数:
0
引用数:
0
h-index:
0
机构:
辽宁师范大学计算机与信息技术学院
任永功
;
论文数:
引用数:
h-index:
机构:
杨雪
;
论文数:
引用数:
h-index:
机构:
杨荣杰
;
论文数:
引用数:
h-index:
机构:
胡志冬
.
计算机科学,
2013,
40
(10)
:252
-256
[2]
特征选择方法与算法的研究
[J].
论文数:
引用数:
h-index:
机构:
李敏
;
论文数:
引用数:
h-index:
机构:
卡米力·木依丁
.
计算机技术与发展,
2013,
23
(12)
:16
-21
[3]
文本分类中信息增益特征选择算法的改进
[J].
论文数:
引用数:
h-index:
机构:
郭颂
;
马飞
论文数:
0
引用数:
0
h-index:
0
机构:
平顶山学院软件学院
信阳师范学院计算机与信息技术学院
马飞
.
计算机应用与软件,
2013,
30
(08)
:139
-142
[4]
一类基于信息熵的多标签特征选择算法
[J].
论文数:
引用数:
h-index:
机构:
张振海
;
李士宁
论文数:
0
引用数:
0
h-index:
0
机构:
西北工业大学计算机学院
李士宁
;
李志刚
论文数:
0
引用数:
0
h-index:
0
机构:
西北工业大学计算机学院
李志刚
;
论文数:
引用数:
h-index:
机构:
陈昊
.
计算机研究与发展,
2013,
(06)
:1177
-1184
[5]
基于信息增益的文本特征选择方法
[J].
任永功
论文数:
0
引用数:
0
h-index:
0
机构:
辽宁师范大学计算机与信息技术学院
任永功
;
论文数:
引用数:
h-index:
机构:
杨荣杰
;
论文数:
引用数:
h-index:
机构:
尹明飞
;
论文数:
引用数:
h-index:
机构:
马名威
.
计算机科学,
2012,
39
(11)
:127
-130
[6]
一种改进的文本分类特征选择方法
[J].
论文数:
引用数:
h-index:
机构:
黄秀丽
;
论文数:
引用数:
h-index:
机构:
王蔚
.
计算机工程与应用 ,
2009,
(36)
:129
-130+240
[7]
基于特征信息增益权重的文本分类算法
[J].
论文数:
引用数:
h-index:
机构:
李文斌
;
刘椿年
论文数:
0
引用数:
0
h-index:
0
机构:
北京工业大学计算机学院多媒体与智能软件技术北京重点实验室
北京工业大学计算机学院多媒体与智能软件技术北京重点实验室
刘椿年
;
陈嶷瑛
论文数:
0
引用数:
0
h-index:
0
机构:
石家庄经济学院信息工程系
北京工业大学计算机学院多媒体与智能软件技术北京重点实验室
陈嶷瑛
.
北京工业大学学报,
2006,
(05)
:456
-460
[8]
Neighborhood classifiers[J] . Qinghua Hu,Daren Yu,Zongxia Xie.Expert Systems With Applications . 2006 (2)
←
1
→
共 8 条
[1]
基于信息增益特征关联树的文本特征选择算法
[J].
任永功
论文数:
0
引用数:
0
h-index:
0
机构:
辽宁师范大学计算机与信息技术学院
任永功
;
论文数:
引用数:
h-index:
机构:
杨雪
;
论文数:
引用数:
h-index:
机构:
杨荣杰
;
论文数:
引用数:
h-index:
机构:
胡志冬
.
计算机科学,
2013,
40
(10)
:252
-256
[2]
特征选择方法与算法的研究
[J].
论文数:
引用数:
h-index:
机构:
李敏
;
论文数:
引用数:
h-index:
机构:
卡米力·木依丁
.
计算机技术与发展,
2013,
23
(12)
:16
-21
[3]
文本分类中信息增益特征选择算法的改进
[J].
论文数:
引用数:
h-index:
机构:
郭颂
;
马飞
论文数:
0
引用数:
0
h-index:
0
机构:
平顶山学院软件学院
信阳师范学院计算机与信息技术学院
马飞
.
计算机应用与软件,
2013,
30
(08)
:139
-142
[4]
一类基于信息熵的多标签特征选择算法
[J].
论文数:
引用数:
h-index:
机构:
张振海
;
李士宁
论文数:
0
引用数:
0
h-index:
0
机构:
西北工业大学计算机学院
李士宁
;
李志刚
论文数:
0
引用数:
0
h-index:
0
机构:
西北工业大学计算机学院
李志刚
;
论文数:
引用数:
h-index:
机构:
陈昊
.
计算机研究与发展,
2013,
(06)
:1177
-1184
[5]
基于信息增益的文本特征选择方法
[J].
任永功
论文数:
0
引用数:
0
h-index:
0
机构:
辽宁师范大学计算机与信息技术学院
任永功
;
论文数:
引用数:
h-index:
机构:
杨荣杰
;
论文数:
引用数:
h-index:
机构:
尹明飞
;
论文数:
引用数:
h-index:
机构:
马名威
.
计算机科学,
2012,
39
(11)
:127
-130
[6]
一种改进的文本分类特征选择方法
[J].
论文数:
引用数:
h-index:
机构:
黄秀丽
;
论文数:
引用数:
h-index:
机构:
王蔚
.
计算机工程与应用 ,
2009,
(36)
:129
-130+240
[7]
基于特征信息增益权重的文本分类算法
[J].
论文数:
引用数:
h-index:
机构:
李文斌
;
刘椿年
论文数:
0
引用数:
0
h-index:
0
机构:
北京工业大学计算机学院多媒体与智能软件技术北京重点实验室
北京工业大学计算机学院多媒体与智能软件技术北京重点实验室
刘椿年
;
陈嶷瑛
论文数:
0
引用数:
0
h-index:
0
机构:
石家庄经济学院信息工程系
北京工业大学计算机学院多媒体与智能软件技术北京重点实验室
陈嶷瑛
.
北京工业大学学报,
2006,
(05)
:456
-460
[8]
Neighborhood classifiers[J] . Qinghua Hu,Daren Yu,Zongxia Xie.Expert Systems With Applications . 2006 (2)
←
1
→