基于样本选取的决策树改进算法

被引:19
作者
冯少荣 [1 ,2 ]
肖文俊 [2 ]
机构
[1] 厦门大学信息科学与技术学院
[2] 华南理工大学计算机科学与工程学院
关键词
决策树; 样本选取; ID3算法; 熵; 分类;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
为提高决策树分类算法的精度,通过比较几种经典的决策树分类算法,提出了基于样本选取的改进的决策树分类算法.改进算法基于决策树精度与样本的相关性较大以及决策树只能得到局部最优解的事实,通过反复迭代寻找较优样本,从而在不改变决策树分类算法的前提下,得到较好的决策树分类算法.该算法不针对某个决策树,只利用输入和输出的反馈信息进行迭代,因此通用性较好.实验证明,该改进算法与ID3,C4.5算法平均错误率的比值约为0.82∶1.22∶0.92.
引用
收藏
页码:643 / 647
页数:5
相关论文
共 5 条
[1]   一种基于离散度的决策树改进算法 [J].
郭玉滨 .
山东师范大学学报(自然科学版) , 2006, (03) :129-131
[2]   一种健壮有效的决策树改进模型 [J].
刘鹏 .
计算机工程与应用, 2005, (33)
[3]   数据挖掘中决策树算法的最新进展 [J].
韩慧 ;
毛锋 ;
王文渊 .
计算机应用研究, 2004, (12) :5-8
[4]  
模式分类[M]. 机械工业出版社 , (美)RichardO.Duda等著, 2003
[5]  
Induction of decision trees[J] . J. R. Quinlan.Machine Learning . 1986 (1)