基于离散度的决策树构造方法

被引:5
作者
亓常松
孙吉贵
于海鸿
机构
[1] 吉林大学计算机科学与技术学院
关键词
决策树; 离散度; 属性选择;
D O I
10.13195/j.cd.2008.01.53.qichs.011
中图分类号
TP18 [人工智能理论]; TP311.13 [];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ; 1201 ;
摘要
在构造决策树的过程中,属性选择将影响到决策树的分类精度.对此,讨论了基于信息熵方法和WMR方法的局限性,提出了信息系统中条件属性集的离散度的概念.利用该概念在决策树构造过程中选择划分属性,设计了基于离散度的决策树构造算法DSD.DSD算法可以解决WMR方法在实际应用中的局限性.在UCI数据集上的实验表明,该方法构造的决策树精度与基于信息熵的方法相近,而时间复杂度则优于基于信息熵的方法.
引用
收藏
页码:51 / 55
页数:5
相关论文
共 3 条
  • [1] 基于粗糙集的多变量决策树构造方法
    苗夺谦
    王珏
    [J]. 软件学报, 1997, (06) : 26 - 32
  • [2] Rough sets and intelligent data analysis[J] . Information Sciences . 2002 (1)
  • [3] ROUGH SETS
    PAWLAK, Z
    [J]. INTERNATIONAL JOURNAL OF COMPUTER & INFORMATION SCIENCES, 1982, 11 (05): : 341 - 356