学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于相对文档频的平衡信息增益降维方法
被引:2
作者
:
论文数:
引用数:
h-index:
机构:
任克强
论文数:
引用数:
h-index:
机构:
张国萍
论文数:
引用数:
h-index:
机构:
赵光甫
机构
:
[1]
江西理工大学信息工程学院
来源
:
江西理工大学学报
|
2008年
/ 05期
关键词
:
相对文档频;
特征降维;
信息增益;
文本分类;
D O I
:
10.13265/j.cnki.jxlgdxxb.2008.05.027
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
081203 ;
0835 ;
摘要
:
针对文本分类中信息增益降维方法的不足,提出了一种基于相对文档频的平衡信息增益(RDFBIG)降维方法.实验结果表明,RDFBIG能有效消除不同类别之间语料规模对分类精度的影响,取得了较好的分类效果.
引用
收藏
页码:68 / 71
页数:4
相关论文
共 6 条
[1]
KNN文本分类算法研究
[J].
杨丽华
论文数:
0
引用数:
0
h-index:
0
机构:
西南交通大学信息科学与技术学院
西南交通大学信息科学与技术学院
杨丽华
;
论文数:
引用数:
h-index:
机构:
戴齐
;
郭艳军
论文数:
0
引用数:
0
h-index:
0
机构:
西南交通大学超导研究开发中心
西南交通大学信息科学与技术学院
郭艳军
.
微计算机信息,
2006,
(21)
:269
-270+185
[2]
基于特征信息增益权重的文本分类算法
[J].
论文数:
引用数:
h-index:
机构:
李文斌
;
刘椿年
论文数:
0
引用数:
0
h-index:
0
机构:
北京工业大学计算机学院多媒体与智能软件技术北京重点实验室
北京工业大学计算机学院多媒体与智能软件技术北京重点实验室
刘椿年
;
论文数:
引用数:
h-index:
机构:
陈嶷瑛
.
北京工业大学学报,
2006,
(05)
:456
-460
[3]
文本挖掘技术研究进展
[J].
袁军鹏
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学公共管理学院
清华大学公共管理学院
袁军鹏
;
论文数:
引用数:
h-index:
机构:
朱东华
;
李毅
论文数:
0
引用数:
0
h-index:
0
机构:
空军济南四站厂
清华大学公共管理学院
李毅
;
论文数:
引用数:
h-index:
机构:
李连宏
;
论文数:
引用数:
h-index:
机构:
黄进
.
计算机应用研究,
2006,
(02)
:1
-4
[4]
网页与文本自动分类综述
[J].
王明文
论文数:
0
引用数:
0
h-index:
0
机构:
江西师范大学计算机信息工程学院
王明文
;
付雪峰
论文数:
0
引用数:
0
h-index:
0
机构:
江西师范大学计算机信息工程学院
付雪峰
;
左家莉
论文数:
0
引用数:
0
h-index:
0
机构:
江西师范大学计算机信息工程学院
左家莉
.
南昌工程学院学报,
2005,
(03)
:20
-25
[5]
文本分类中的特征降维方法综述[J]. 陈涛,谢阳群.情报学报. 2005 (06)
[6]
Machine learning in automated text categorization
[J].
Sebastiani, F
论文数:
0
引用数:
0
h-index:
0
机构:
CNR, Ist Elaboraz Informaz, I-56124 Pisa, Italy
CNR, Ist Elaboraz Informaz, I-56124 Pisa, Italy
Sebastiani, F
.
ACM COMPUTING SURVEYS,
2002,
34
(01)
:1
-47
←
1
→
共 6 条
[1]
KNN文本分类算法研究
[J].
杨丽华
论文数:
0
引用数:
0
h-index:
0
机构:
西南交通大学信息科学与技术学院
西南交通大学信息科学与技术学院
杨丽华
;
论文数:
引用数:
h-index:
机构:
戴齐
;
郭艳军
论文数:
0
引用数:
0
h-index:
0
机构:
西南交通大学超导研究开发中心
西南交通大学信息科学与技术学院
郭艳军
.
微计算机信息,
2006,
(21)
:269
-270+185
[2]
基于特征信息增益权重的文本分类算法
[J].
论文数:
引用数:
h-index:
机构:
李文斌
;
刘椿年
论文数:
0
引用数:
0
h-index:
0
机构:
北京工业大学计算机学院多媒体与智能软件技术北京重点实验室
北京工业大学计算机学院多媒体与智能软件技术北京重点实验室
刘椿年
;
论文数:
引用数:
h-index:
机构:
陈嶷瑛
.
北京工业大学学报,
2006,
(05)
:456
-460
[3]
文本挖掘技术研究进展
[J].
袁军鹏
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学公共管理学院
清华大学公共管理学院
袁军鹏
;
论文数:
引用数:
h-index:
机构:
朱东华
;
李毅
论文数:
0
引用数:
0
h-index:
0
机构:
空军济南四站厂
清华大学公共管理学院
李毅
;
论文数:
引用数:
h-index:
机构:
李连宏
;
论文数:
引用数:
h-index:
机构:
黄进
.
计算机应用研究,
2006,
(02)
:1
-4
[4]
网页与文本自动分类综述
[J].
王明文
论文数:
0
引用数:
0
h-index:
0
机构:
江西师范大学计算机信息工程学院
王明文
;
付雪峰
论文数:
0
引用数:
0
h-index:
0
机构:
江西师范大学计算机信息工程学院
付雪峰
;
左家莉
论文数:
0
引用数:
0
h-index:
0
机构:
江西师范大学计算机信息工程学院
左家莉
.
南昌工程学院学报,
2005,
(03)
:20
-25
[5]
文本分类中的特征降维方法综述[J]. 陈涛,谢阳群.情报学报. 2005 (06)
[6]
Machine learning in automated text categorization
[J].
Sebastiani, F
论文数:
0
引用数:
0
h-index:
0
机构:
CNR, Ist Elaboraz Informaz, I-56124 Pisa, Italy
CNR, Ist Elaboraz Informaz, I-56124 Pisa, Italy
Sebastiani, F
.
ACM COMPUTING SURVEYS,
2002,
34
(01)
:1
-47
←
1
→