一种改进的C4.5算法及实验分析

被引:11
作者
刘佳
王新伟
机构
[1] 华东师范大学计算机科学技术系
关键词
C4.5; 划分点; 离散化; 惩罚项;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
081202 ;
摘要
C4.5算法在对连续值属性进行离散化处理时,需要计算所有潜在划分的信息增益,由于不能快速找到最佳划分点,因此在算法时间复杂度方面存在一定局限。基于Fayyad和Irani的证明,对C4.5算法在连续值属性离散化和连续值属性惩罚项等方面进行了改进。实验结果表明,改进算法能够从总体上提高算法执行效率,在降低算法的分类错误率方面也具有应用的潜力。
引用
收藏
页码:260 / 262
页数:3
相关论文
共 3 条
[1]   ON THE HANDLING OF CONTINUOUS-VALUED ATTRIBUTES IN DECISION TREE GENERATION [J].
FAYYAD, UM ;
IRANI, KB .
MACHINE LEARNING, 1992, 8 (01) :87-102
[2]  
Induction of decision trees[J] . J. R. Quinlan.Machine Learning . 1986 (1)
[3]  
UCI Repository of machine learning databases .2 www.ics.uci.edu/~mlearn/MLRepository.html . 1998