基于分类规则的C4.5决策树改进算法

被引:22
作者
李孝伟
陈福才
李邵梅
机构
[1] 国家数字交换系统工程技术研究中心
关键词
C4.5决策树; 分类规则; 属性度量; 划分相似度; 特征选取;
D O I
10.16208/j.issn1000-7024.2013.12.060
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
为解决大样本数据条件下C4.5决策树算法需要训练集常驻内存、分类精度达不到需求以及如何选取最优分类规则等问题,提出了一种基于分类规则选取的C4.5决策树改进算法。通过数次有放回的随机抽取训练集形成多个分类规则,在多次分类规则内寻找特征的最优取值以建立最优分类规则,以划分相似度为标准进行C4.5决策树最优特征选取,在此基础上利用选定的最优分类规则和最优特征对C4.5决策树算法进行改进。实验结果表明,改进后的算法可有效解决C4.5决策树与初始训练集相关性较大的问题,对大样本数据集的分类识别在识别率上有显著提高,训练时间明显减少。
引用
收藏
页码:4321 / 4325+4330 +4330
页数:6
相关论文
共 7 条
[1]   基于最短划分距离的网络流量决策树分类方法 [J].
杨哲 ;
李领治 ;
纪其进 ;
朱艳琴 .
通信学报, 2012, (03) :90-102
[2]   基于改进的C4.5算法的网络流量分类方法 [J].
周剑峰 ;
阳爱民 ;
刘吉财 .
计算机工程与应用, 2012, 48 (05) :71-74
[3]   决策树C4.5连续属性分割阈值算法改进及其应用 [J].
姚亚夫 ;
邢留涛 .
中南大学学报(自然科学版), 2011, 42 (12) :3772-3776
[4]   基于样本选取的决策树改进算法 [J].
冯少荣 ;
肖文俊 .
西南交通大学学报, 2009, 44 (05) :643-647
[5]   决策树算法的研究与改进 [J].
冯少荣 .
厦门大学学报(自然科学版), 2007, (04) :496-500
[6]   一种有效的C4.5改进模型 [J].
刘鹏 ;
姚正 ;
尹俊杰 .
清华大学学报(自然科学版), 2006, (S1) :996-1001
[7]  
A novel hybrid intelligent method based on C4.5 decision tree classifier and one-against-all approach for multi-class classification problems[J] . Expert Systems With Applications . 2007 (2)