一种大规模数据库的组合优化决策树算法

被引:6
作者
赵静娴 [1 ,2 ]
倪春鹏 [1 ]
詹原瑞 [1 ]
杜子平 [2 ]
机构
[1] 天津大学管理学院
[2] 天津科技大学经管学院
关键词
离散化; 降维; 属性选择; 决策树; 数据挖掘;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
提出了一种适合于大规模高维数据库的组合优化决策树算法。相比于传统的类似算法,该算法从数据的离散化,降维,属性选择三方面进行改进,对决策树建立过程中不适应大规模高维数据库的主要环节进行了优化,有效解决了处理大规模高维数据库问题的效率和精度之间的矛盾。仿真试验表明,该算法在大大减少了计算代价的同时提高了决策树的分类精度。
引用
收藏
页码:583 / 587
页数:5
相关论文
共 7 条
[1]   一种高效的基于排序的RBF神经网络属性选择方法 [J].
文专 ;
王正欧 .
计算机应用, 2003, (08) :34-36+40
[2]   基于信息熵的特征子集选择启发式算法的研究 [J].
钱国良 ;
舒文豪 ;
陈彬 ;
权光日 .
软件学报, 1998, (12) :32-37
[3]   General and efficient multisplitting of numerical attributes [J].
Elomaa, T ;
Rousu, J .
MACHINE LEARNING, 1999, 36 (03) :201-244
[4]   Families of splitting criteria for classification trees [J].
Shih, YS .
STATISTICS AND COMPUTING, 1999, 9 (04) :309-315
[5]  
Attribute selection for modelling[J] . Igor Kononenko,Se June Hong.Future Generation Computer Systems . 1997 (2)
[6]   A FURTHER COMPARISON OF SPLITTING RULES FOR DECISION-TREE INDUCTION [J].
BUNTINE, W ;
NIBLETT, T .
MACHINE LEARNING, 1992, 8 (01) :75-85
[7]  
Induction of decision trees[J] . J. R. Quinlan.Machine Learning . 1986 (1)