基于相对文档频的平衡信息增益降维方法

被引:2
作者
任克强
张国萍
赵光甫
机构
[1] 江西理工大学信息工程学院
关键词
相对文档频; 特征降维; 信息增益; 文本分类;
D O I
10.13265/j.cnki.jxlgdxxb.2008.05.027
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
针对文本分类中信息增益降维方法的不足,提出了一种基于相对文档频的平衡信息增益(RDFBIG)降维方法.实验结果表明,RDFBIG能有效消除不同类别之间语料规模对分类精度的影响,取得了较好的分类效果.
引用
收藏
页码:68 / 71
页数:4
相关论文
共 6 条
[1]   KNN文本分类算法研究 [J].
杨丽华 ;
戴齐 ;
郭艳军 .
微计算机信息, 2006, (21) :269-270+185
[2]   基于特征信息增益权重的文本分类算法 [J].
李文斌 ;
刘椿年 ;
陈嶷瑛 .
北京工业大学学报, 2006, (05) :456-460
[3]   文本挖掘技术研究进展 [J].
袁军鹏 ;
朱东华 ;
李毅 ;
李连宏 ;
黄进 .
计算机应用研究, 2006, (02) :1-4
[4]   网页与文本自动分类综述 [J].
王明文 ;
付雪峰 ;
左家莉 .
南昌工程学院学报, 2005, (03) :20-25
[5]  
文本分类中的特征降维方法综述[J]. 陈涛,谢阳群.情报学报. 2005 (06)
[6]   Machine learning in automated text categorization [J].
Sebastiani, F .
ACM COMPUTING SURVEYS, 2002, 34 (01) :1-47