改进SPRINT算法及其在分布式环境下的研究

被引:6
作者
于蕾
刘大有
高滢
田野
机构
[1] 吉林大学计算机科学与技术学院
基金
国家自然科学基金重大项目;
关键词
决策树; SPRINT算法; 分布式环境;
D O I
10.13413/j.cnki.jdxblxb.2008.06.041
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
通过引入一种动态数据结构,解决了SPRINT算法使用多个属性列表存储数据、占用过多系统资源、需创建哈希表对属性列表进行分割以及节点分割处理相对复杂的问题,并探讨了改进算法在分布式环境下的工作过程.实验结果表明,改进的算法减少了属性列表占用的存储空间以及分割节点操作所需的时间.
引用
收藏
页码:1119 / 1124
页数:6
相关论文
共 4 条
[1]   决策树分类技术研究 [J].
栾丽华 ;
吉根林 .
计算机工程, 2004, (09) :94-96+105
[2]  
数据仓库与数据挖掘技术[M]. 电子工业出版社 , , 2002
[3]  
PUBLIC: A Decision Tree Classifier that Integrates Building and Pruning[J] . Rajeev Rastogi,Kyuseok Shim.Data Mining and Knowledge Discovery . 2000 (4)
[4]  
Induction of decision trees[J] . J. R. Quinlan.Machine Learning . 1986 (1)