分布式决策树算法研究与实现

被引:3
作者
戴南
吉根林
机构
[1] 南京师范大学数学与计算机科学学院
关键词
分类; 决策树; 分布式决策树;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
081202 ;
摘要
提出了一种基于分布多库环境下的决策树生成算法DDTA(D istributed D ecision Tree A lgorithm).该算法使用基于信息熵增益的思想分割各个分布的、同构训练样本集,各分布站点利用服务器传来的分割属性分割自己的样本集,服务器则通过对所有分布站点传来的信息计算各个属性的信息熵增益得到分割属性.实验表明DDTA算法能对分布同构样本集进行有效决策树挖掘,分布多库环境下生成的决策树是正确的.与算法INDUS相比,该算法的通信代价小.
引用
收藏
页码:46 / 48
页数:3
相关论文
共 1 条
[1]  
Induction of dec ision trees. Qu in lan J R. Machine Learning . 1986