结合欠抽样与集成的软件缺陷预测

被引:15
作者
李勇 [1 ,2 ]
机构
[1] 新疆师范大学网络信息安全与舆情分析重点实验室
[2] 南京航空航天大学计算机科学与技术学院
关键词
软件缺陷预测; 类不平衡数据; 欠抽样; 决策树; 集成算法;
D O I
暂无
中图分类号
TP311.53 [];
学科分类号
摘要
软件缺陷预测是提高测试效率、保证软件可靠性的重要途径。为了提高软件缺陷预测的准确率,提出一种结合欠抽样与决策树分类器集成的软件缺陷预测模型。考虑到软件缺陷数据的类不平衡特性,首先,通过数据的不平衡率确定抽样度,执行欠抽样实现数据的重新平衡;然后,采用Bagging随机抽样原理训练若干个决策树子分类器;最后,按照少数服从多数的原则生成预测模型。使用公开的NASA软件缺陷预测数据集进行了仿真实验。实验结果表明,与3种基准方法对比,所提模型在保证预报率的前提下,误报率(PF)降低了10%以上,综合评价指标均有显著提升。该模型的缺陷预测误报率较低,而且具有较高的预测准确率与稳定性。
引用
收藏
页码:2291 / 2294+2310 +2310
页数:5
相关论文
共 3 条
[1]
不平衡数据的集成分类算法综述 [J].
李勇 ;
刘战东 ;
张海军 .
计算机应用研究, 2014, 31 (05) :1287-1291
[2]
基于AGA-LVQ神经网络的软件可靠性预测模型研究 [J].
乔辉 ;
周雁舟 ;
邵楠 ;
高杨 ;
粟登银 .
计算机科学, 2013, 40 (01) :179-182
[3]
一种基于模糊支持向量机软件模块缺陷检测算法 [J].
郭丽娜 ;
杨杨 .
南京大学学报(自然科学版), 2012, 48 (02) :221-227