对Chi2系列算法的改进方法

被引:3
作者
桑雨 [1 ]
闫德勤 [1 ]
梁宏霞 [1 ]
李克秋 [2 ]
机构
[1] 辽宁师范大学计算机系
[2] 大连理工大学计算机系
关键词
连续属性离散化; Chi2算法; 粗糙集; 差异序列;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
Chi2系列算法是基于概率统计理论的连续属性离散化重要方法.论文对Chi2相关算法进行了深入分析,指出其中的不足,提出一种新的连续属性离散化方法:Rectified Chi2算法.新算法给出一种新的区间合并依据,能够更合理更有效地对连续属性进行离散化.在此基础上,考虑仅以最大差异为区间合并标准存在不合理性,提出一种基于差异序列为标准的区间合并方法,该方法可以大大提高Chi2系列算法的离散化效果.实验结果证明了上述算法的有效性.
引用
收藏
页码:524 / 529
页数:6
相关论文
共 3 条
[1]  
支持向量机导论[M]. 电子工业出版社 , (英)NelloCristianini,(英)JohnShawe-Taylor著, 2004
[2]  
Rough集理论与知识获取[M]. 西安交通大学出版社 , 王国胤编著, 2001
[3]  
Feature selection via discretization. Liu H,Setiono R. IEEE Transactions on Knowledge and Data Engineering . 1997