关于ID3算法的最优性证明

被引:5
作者
翟俊海
张素芳
王熙照
机构
[1] 河北大学数学与计算机学院
关键词
决策树; ID3算法; 信息熵; 划分;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
081202 ;
摘要
研究了一个属性的某几个属性值并的权熵之和与该属性单个属性值的权熵之和的关系.通过构建模型,从理论上证明了以信息熵作为度量标准,ID3算法是最优的,生成的树是最小的,产生的规则数是最少的.
引用
收藏
页码:547 / 550+556 +556
页数:5
相关论文
共 5 条
[1]   基于属性间交互信息的ID3算法 [J].
谢竞博 ;
王熙照 .
计算机工程与应用, 2004, (30) :93-94+150
[2]   基于决策树的学习算法 [J].
杨清 ;
杨岳湘 .
湘潭师范学院学报(社会科学版), 1999, (03) :58-62
[3]   基于熵的决策树分枝合并算法 [J].
毕建东,杨挂芳 .
哈尔滨工业大学学报, 1997, (02) :44-46
[4]  
信息论基础及应用[M]. 清华大学出版社 , 曲炜, 2005
[5]  
MMDT: a multi-valued and multi-labeled decision tree classifier for data mining[J] . Shihchieh Chou,Chang-Ling Hsu.Expert Systems With Applications . 2005 (4)