基于互信息最大化和特征聚类的特征选择

被引:1
作者
张成彬 [1 ]
唐建 [2 ]
机构
[1] 盐城工学院信息工程学院
[2] 盐城市工商行政管理局
关键词
互信息最大化; 特征聚类; 邮件识别;
D O I
暂无
中图分类号
TP393.098 [];
学科分类号
080402 ;
摘要
提出一种互信息最大化和特征聚类相结合的特征选择法,并将其应用于邮件识别。通过互信息最大化从原始特征空间中选择次优特征子集,借助于特征空间的聚类来剔除冗余特征,从而实现特征空间的再次降维。实验结果表明该方法是一种有效的特征选择法。
引用
收藏
页码:31 / 33
页数:3
相关论文
共 8 条
[1]   Machine learning in automated text categorization [J].
Sebastiani, F .
ACM COMPUTING SURVEYS, 2002, 34 (01) :1-47
[2]   基于互信息最大化的特征选择算法及应用 [J].
唐亮 ;
段建国 ;
许洪波 ;
梁玲 .
计算机工程与应用, 2008, (13) :130-133
[3]   基于Fisher准则和特征聚类的特征选择 [J].
王飒 ;
郑链 .
计算机应用, 2007, (11) :2812-2813+2840
[4]   一种基于信息增益的K-NN改进算法 [J].
魏孝章 ;
豆增发 .
计算机工程与应用, 2007, (19) :188-191
[5]   基于χ2统计量的kNN文本分类算法 [J].
印鉴 ;
谭焕云 .
小型微型计算机系统, 2007, (06) :1094-1097
[6]   基于改进Nave Bayes的垃圾邮件过滤模型研究 [J].
王涛 ;
裘国永 ;
何聚厚 .
计算机工程与应用, 2007, (13) :186-190
[7]   基于差分贡献的垃圾邮件过滤特征选择方法 [J].
张文良 ;
黄亚楼 ;
倪维健 .
计算机工程, 2007, (08) :80-82
[8]   中文文本分类中特征抽取方法的比较研究 [J].
代六玲 ;
黄河燕 ;
陈肇雄 .
中文信息学报, 2004, (01) :26-32