基于C4.5决策树的流量分类方法

被引:177
作者
徐鹏 [1 ,2 ]
林森 [1 ,2 ]
机构
[1] 中国科学院软件研究所
[2] 中国科学院研究生院
关键词
流量分类; 网络测量; 决策树; 网络流; 统计属性;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
近年来,利用机器学习方法处理流量分类问题成为网络测量领域一个新兴的研究方向.在现有研究中,朴素贝叶斯方法及其改进算法以其实现简单、分类高效的特点而被广泛应用.但此类方法过分依赖于样本在样本空间的分布,具有潜在的不稳定性.为此,引入C4.5决策树方法来处理流量分类问题.该方法利用训练数据集中的信息熵来构建分类模型,并通过对分类模型的简单查找来完成未知网络流样本的分类.理论分析和实验结果都表明,利用C4.5决策树来处理流量分类问题在分类稳定性上均具有明显的优势.
引用
收藏
页码:2692 / 2704
页数:13
相关论文
共 2 条
[1]  
基于决策树的分类算法研究[D]. 关晓蔷.山西大学. 2006
[2]  
Solving the app-level classification problem of P2P traffic via optimized support vector machines .2 Wang R,Liu Y,Yang YX,et al. Proc of the 6th Int’’l Conf on Intelligent Systems Design and Applications (ISDA 2006) . 2006