PC4.5:用于不均衡数据集的C4.5改进算法

被引:3
作者
周荃 [1 ,2 ]
王崇骏 [1 ,2 ]
王王君 [1 ,2 ]
陈世福 [1 ,2 ]
机构
[1] 南京大学计算机软件新技术国家重点实验室
[2] 计算机科学与技术系
关键词
C4.5; PC4.5; 入侵检测; 不均衡性;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
摘要
样本的不均衡性直接影响分类器的精度,基于C4.5算法提出一种改进算法——PC4.5,并应用于MIT数据集.实验表明该算法能很好地处理训练集的不均衡性,并降低决策树的规模.
引用
收藏
页码:23 / 26
页数:4
相关论文
共 1 条
  • [1] 训练集类别分布对文本分类的影响
    张启蕊
    张凌
    董守斌
    谭景华
    [J]. 清华大学学报(自然科学版), 2005, (S1) : 1802 - 1805