分支合并对决策树归纳学习的影响

被引:18
作者
王熙照
杨晨晓
机构
[1] 河北大学数学与计算机学院
关键词
决策树归纳; 归纳偏置; 剪枝; 分支合并; 信息增益; 增益补偿;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
传统的决策树构建方法,由于其选择扩展属性时的归纳偏置,导致属性值较多的属性总会被优先选择,从而导致树的规模过大,并且泛化能力下降,因此需对其进行简化.剪枝是简化的一种,分为预剪枝和后剪枝.该文主要针对预剪枝中的分支合并进行研究.文中研究了分支合并对决策树归纳学习的影响;具体讨论了在决策树的产生过程中,选择适当的分支合并策略对决策树进行分钟合并处理后,能否增强树的可理解性,减少树的复杂程度以及提高树的泛化精度;基于信息增益,分析了分支合并后决策树的复杂程度,设计实现了一种基于正例比的分支合并算法SSID和一种基于最大增益补偿的分支合并算法MCID.实验结果显示:SSID和MCID所得到的决策树在可理解性和泛化精度方面均明显优于See5.
引用
收藏
页码:1251 / 1258
页数:8
相关论文
共 4 条
[1]   一种新的简化ID3决策树的算法 [J].
吴宣为 ;
史斌宁 .
合肥工业大学学报(自然科学版), 2004, (12) :1565-1569
[2]   基于熵的决策树分枝合并算法 [J].
毕建东,杨挂芳 .
哈尔滨工业大学学报, 1997, (02) :44-46
[3]   一种新的决策树归纳学习算法 [J].
洪家荣 ;
丁明峰 ;
李星原 ;
王丽薇 .
计算机学报, 1995, (06) :470-474
[4]  
Induction of decision trees[J] . J. R. Quinlan.Machine Learning . 1986 (1)