基于变精度粗糙集的分类决策树构造方法

被引:8
作者
庞哈利
高政威
左军伟
卞玉倩
机构
[1] 东北大学信息科学与工程学院
基金
国家自然科学基金重点项目;
关键词
决策树; 变精度粗集; 近似分类精度; 属性分类重要性测度;
D O I
暂无
中图分类号
TP391.41 [];
学科分类号
080203 ;
摘要
针对分类决策树构造时最优属性选择困难、难以适合大规模数据集的问题,提出新的属性选择标准——属性分类重要性测度,引入置信度和支持度,设计了基于变精度粗集理论的决策树算法。分类重要性测度可全面刻画属性的综合分类能力,且计算比信息增益简单。决策树生长过程中引入支持度和置信度,以控制决策树的生长,提高决策树对噪声数据集和不相容数据集的处理能力,减小决策树的规模。通过对UCI上5个不同规模和类型的数据集进行测试计算,结果表明算法效率高于ID3算法,与UCI报告的最好结果相当。
引用
收藏
页码:2160 / 2163
页数:4
相关论文
共 7 条
[1]   基于Rough集的决策树算法 [J].
乔梅 ;
韩文秀 .
天津大学学报, 2005, (09) :842-846
[2]   知识的粒度计算及其应用 [J].
苗夺谦 ;
范世栋 .
系统工程理论与实践, 2002, (01) :48-56
[3]   粗集在决策树优化中的应用 [J].
赵卫东 ;
李旗号 .
系统工程学报, 2001, (04) :289-295
[4]  
基于粗糙集的不确定决策[M]. 清华大学出版社 , 张文修,仇国芳著, 2005
[5]  
Classification with Bayesian MARS[J] . C.C. Holmes,D.G.T. Denison.Machine Learning . 2003 (1)
[6]  
Induction of decision trees[J] . J. R. Quinlan.Machine Learning . 1986 (1)
[7]   ROUGH SETS [J].
PAWLAK, Z .
INTERNATIONAL JOURNAL OF COMPUTER & INFORMATION SCIENCES, 1982, 11 (05) :341-356