决策树分类算法研究

被引:51
作者
张琳
陈燕
李桃迎
牟向伟
机构
[1] 大连海事大学交通运输管理学院
基金
高等学校博士学科点专项科研基金;
关键词
ID3算法; 信息增益; 属性重要性; 属性取值数量; 信息熵;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
ID3算法在选择分裂属性时偏向于选取属性取值较多的属性。针对该问题,引入属性重要性和属性取值数量2个参数对ID3算法的信息增益公式进行改进,从而提高取值数量少但较为关键的属性的重要性,使算法更好地反映实际决策情况,并根据凸函数的性质简化信息熵的计算,提高决策树的构造效率。通过实例介绍改进算法的具体应用方法,证明其性能相比原算法有所提高。
引用
收藏
页码:66 / 67+70 +70
页数:3
相关论文
共 10 条
[1]   基于属性相似度的决策树算法 [J].
陆秋 ;
程小辉 .
计算机工程, 2009, 35 (06) :82-84
[2]   基于属性值的ID3算法改进 [J].
孙爱东 ;
朱梅阶 ;
涂淑琴 .
计算机工程与设计, 2008, (12) :3011-3012+3033
[3]   基于属性重要度的ID3改进算法 [J].
邹永贵 ;
范程华 .
计算机应用, 2008, (S1) :144-145+149
[4]   利用上凸函数对决策树算法的改进 [J].
高学东 ;
尹阿东 ;
张健 ;
宫雨 ;
武森 .
中国管理科学, 2004, (04) :145-149
[5]   决策树分类技术研究 [J].
栾丽华 ;
吉根林 .
计算机工程, 2004, (09) :94-96+105
[6]   ID3算法的一种改进算法 [J].
曲开社 ;
成文丽 ;
王俊红 ;
不详 .
计算机工程与应用 , 2003, (25) :104-107
[7]   一种新的基于属性-值对的决策树归纳算法 [J].
郭茂祖 ;
刘扬 .
小型微型计算机系统, 2001, (04) :459-461
[8]   决策树的优化算法 [J].
刘小虎 ;
李生 .
软件学报, 1998, (10) :78-81
[9]  
数据挖掘技术应用实例.[M].纪希禹; 主编.机械工业出版社.2009,
[10]  
数据挖掘技术及应用.[M].陈安;陈宁;周龙骧等编著;.科学出版社.2006,