一种有效的C4.5改进模型

被引:27
作者
刘鹏
姚正
尹俊杰
机构
[1] 上海财经大学信息管理与工程学院
[2] 上海财经大学信息管理与工程学院 上海200433
关键词
决策树; R-C4.5; C4.5; 分类器; 数据挖掘;
D O I
10.16511/j.cnki.qhdxxb.2006.s1.016
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
介绍了一种有效的决策树改进模型:R-C 4.5及其简化版本,旨在构造一棵简单的树,同时提高决策树属性选择度量的可解释性,减少空枝和无意义分枝,以及过度拟合。该决策树模型基于著名的C 4.5决策树模型,但在属性的选取和分枝策略上进行了改进。在R-C 4.5中,通过合并分类效果差的分枝,有效避免了碎片等问题。实验表明,R-C 4.5决策树在保持模型预测准确率的同时,有效改进了树的健壮性。作为R-C 4.5的简化版本,R-C 4.5c和R-C 4.5s可生成更为简单的树,而且R-C 4.5s通过数据预处理阶段完成,易于实现。
引用
收藏
页码:996 / 1001
页数:6
相关论文
共 1 条
[1]  
知识发现[M]. - 清华大学出版社 , 史忠植著, 2002