基于互信息和关系积理论的特征选择方法

被引:10
作者
何绍荣
梁金明
何志勇
机构
[1] 四川理工学院计算机学院
关键词
特征选择; 互信息; 粗糙集; 关系积理论; 属性约简;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
研究互信息理论,针对其不足引进粗糙集并给出一个基于关系积理论的属性约简算法,以此为基础提出一个适用于海量文本数据集的特征选择方法。该方法使用互信息进行特征初选,利用所给的属性约简算法消除冗余,从而获得具有代表性的特征子集。实验结果表明,该特征选择方法效果良好。
引用
收藏
页码:257 / 259
页数:3
相关论文
共 7 条
  • [1] 一种新的基于多启发式的特征选择算法
    朱颢东
    钟勇
    [J]. 计算机应用, 2009, 29 (03) : 849 - 851
  • [2] 一种基于CFN的特征选择及权重算法
    柴忠
    常晓明
    [J]. 微计算机信息, 2009, 25 (03) : 221 - 222+283
  • [3] 关系积理论及属性约简算法
    焦吉成
    高学东
    王元璞
    赵传领
    [J]. 山东大学学报(工学版), 2008, (02) : 112 - 116+126
  • [4] 中文文本分类中的特征选择研究
    寇苏玲
    蔡庆生
    [J]. 计算机仿真, 2007, (03) : 289 - 291
  • [5] 智能计算[M]. 重庆大学出版社 , 曾黄麟著, 2004
  • [6] Mining Text Data:Special Features and Patterns .2 Delgado M,Martin-Bautista M J,Sanchez D,et al. Proc.of ESF Exploratory Workshop . 2002
  • [7] A Comparative Study on Feature Selection in Text Categorization .2 Yang Y,Pedersen J O. The Fourteenth International Conference on Machine Learning . 1997