一种基于粗糙集和信息熵理论的属性离散化算法

被引:2
作者
侯荣涛
史鑫明
路郁
机构
[1] 南京信息工程大学江苏省网络监控中心
[2] 南京信息工程大学计算机与软件学院
关键词
决策树; 离散化; 粗糙集; 信息熵; 可辨识矩阵;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
在分析和研究C5算法中连续属性处理的必要性及C5算法中离散化方法的不足后,采用基于粗糙集理论-信息熵-可辨识矩阵的离散化的方法(RSIEDM)进行离散化。该方法利用粗糙集、信息熵和可辨识矩阵能更合理、更准确地对连续属性进行离散化,使创建的决策树具有更好的准确率。在优化雷电灾害统计和评估雷电灾害导致的损失应用中,该算法取得了较好的效果。
引用
收藏
页码:259 / 262
页数:4
相关论文
共 9 条
[1]  
数据挖掘原理与算法.[M].邵峰晶;于忠清编著;.中国水利水电出版社.2003,
[2]   对Chi2系列算法的改进方法 [J].
桑雨 ;
闫德勤 ;
梁宏霞 ;
李克秋 .
小型微型计算机系统, 2009, 30 (03) :524-529
[3]   基于决策协调度的最简决策树生成算法 [J].
毛聪莉 ;
易波 .
计算机工程与设计, 2008, (05) :1250-1252
[4]   分支合并对决策树归纳学习的影响 [J].
王熙照 ;
杨晨晓 .
计算机学报, 2007, (08) :1251-1258
[5]   粗糙集中连续属性离散化的一种新方法 [J].
何亚群 ;
胡寿松 .
南京航空航天大学学报, 2003, (02) :212-215
[6]   一种基于云模型的决策表连续属性离散化方法 [J].
李兴生 ;
李德毅 .
模式识别与人工智能, 2003, 16 (01) :33-38
[7]   粗糙集理论中的离散化问题 [J].
侯利娟 ;
王国胤 ;
聂能 ;
吴渝 .
计算机科学, 2000, (12) :89-94
[8]   A comparison of predictive methods in extinction risk studies: Contrasts and decision trees [J].
Sullivan, Matthew S. ;
Jones, Martin J. ;
Lee, David C. ;
Marsden, Stuart J. ;
Fielding, Alan H. ;
Young, Emily V. .
BIODIVERSITY AND CONSERVATION, 2006, 15 (06) :1977-1991
[9]   ON THE HANDLING OF CONTINUOUS-VALUED ATTRIBUTES IN DECISION TREE GENERATION [J].
FAYYAD, UM ;
IRANI, KB .
MACHINE LEARNING, 1992, 8 (01) :87-102