基于可变精度的ID3改进算法

被引:8
作者
王艳兵
赵锐
姚青
机构
[1] 山东大学计算机科学与技术学院
关键词
数据挖掘; 决策树; 粗糙集; ID3; 熵;
D O I
10.16208/j.issn1000-7024.2006.14.056
中图分类号
TP301.6 [算法理论];
学科分类号
081202 ;
摘要
ID3算法是数据挖掘中经典的决策树分类算法,该算法具有抗噪声能力差的缺点。通过对ID3算法的研究,依据可变精度粗糙集理论的思想,采用在计算属性信息熵时设定阈值的方法,以放宽属性选择的要求,从而对经典的ID3算法做了相应的改进。改进后的ID3算法(VPID3)可在一定程度上降低噪声对系统分类的干扰,使分类结果更加符合实际要求。最后通过举例,说明了改进算法的可行性。
引用
收藏
页码:2683 / 2685
页数:3
相关论文
共 5 条
[1]   基于改进ID3算法的轨迹化决策研究 [J].
丁华 ;
张少中 ;
王秀坤 .
计算机工程与设计, 2004, (10) :1721-1723
[2]   信息熵在粗糙集理论中的应用 [J].
梁吉业 ;
孟晓伟 .
山西大学学报(自然科学版), 2002, (03) :281-284
[3]   基于熵和变精度粗糙集的规则不确定性量度 [J].
陈湘晖 ;
朱善君 ;
吉吟东 .
清华大学学报(自然科学版), 2001, (03) :109-112
[4]  
Rough集理论与知识获取[M]. - 西安交通大学出版社 , 王国胤编著, 2001
[5]  
Induction of decision trees[J] . J. R. Quinlan.Machine Learning . 1986 (1)