基于粗糙集和灰色关联度的综合性特征选择

被引:5
作者
朱颢东 [1 ,2 ]
钟勇 [1 ,2 ]
机构
[1] 中国科学院成都计算机应用研究所
[2] 中国科学院研究生院
关键词
特征空间; 文档频; 粗糙集; 灰色关联度; 属性约简;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
在文本特征空间中,特征维数通常高达几万,这大大限制了分类算法的选择,降低了分类算法的性能,影响了分类器的设计,为此需要进行特征选择以避免"维数灾难"。提出了一个综合性的特征选择方法,该方法首先利用一个优化的文档频进行特征初选以过滤掉一些词条来降低特征空间的稀疏性,然后利用一个基于粗糙集和灰色关联度的属性约简算法来消除冗余,从而获得较具代表性的特征子集。实验结果表明该综合性方法效果良好。
引用
收藏
页码:6 / 9+13 +13
页数:5
相关论文
共 9 条
[1]   一种新的基于多启发式的特征选择算法 [J].
朱颢东 ;
钟勇 .
计算机应用, 2009, 29 (03) :849-851
[2]   自动文本分类特征选择方法研究 [J].
张海龙 ;
王莲芝 .
计算机工程与设计, 2006, (20) :3838-3841
[3]   中文文本分类中的特征选择算法研究 [J].
胡佳妮 ;
徐蔚然 ;
郭军 ;
邓伟洪 .
光通信研究, 2005, (03) :44-46
[4]   中文文本分类中的特征选择研究 [J].
周茜 ;
赵明生 ;
扈旻 .
中文信息学报, 2004, (03) :17-23
[5]  
灰色系统与粗糙集的比较研究[D]. 周倜.武汉理工大学 2008
[6]  
智能计算[M]. 重庆大学出版社 , 曾黄麟著, 2004
[7]   A new method for measuring uncertainty and fuzziness in rough set theory [J].
Liang, JY ;
Chin, KS ;
Dang, CY ;
Yam, RCM .
INTERNATIONAL JOURNAL OF GENERAL SYSTEMS, 2002, 31 (04) :331-342
[8]   Bayesian Network Classifiers [J].
Nir Friedman ;
Dan Geiger ;
Moises Goldszmidt .
Machine Learning, 1997, 29 :131-163
[9]   ROUGH SETS [J].
PAWLAK, Z .
INTERNATIONAL JOURNAL OF COMPUTER & INFORMATION SCIENCES, 1982, 11 (05) :341-356