不均衡数据下基于阴性免疫的过抽样新算法

被引:11
作者
陶新民 [1 ]
徐晶 [2 ]
童智靖 [1 ]
刘玉 [1 ]
机构
[1] 哈尔滨工程大学信息与通信工程学院
[2] 黑龙江省科技学院数力系
基金
中国博士后科学基金;
关键词
不均衡数据; 阴性免疫; 过抽样算法; 人工少数类过抽样技术;
D O I
10.13195/j.cd.2010.06.70.taoxm.023
中图分类号
TP181 [自动推理、机器学习];
学科分类号
摘要
为提高不均衡数据集下算法分类性能,提出一种基于阴性免疫的过抽样算法.该算法利用阴性免疫实现少数类样本空间覆盖,以生成的检测器中心为人工生成的少数类样本.由于该算法利用的是多数类样本信息生成少数类样本,避免了人工少数类过抽样技术(SMOTE)生成的人工样本缺乏空间代表性的不足.通过实验将此算法与SMOTE算法及其改进算法进行比较,结果表明,该算法不仅有效提高了少数类样本的分类性能,而且总体分类性能也有了显著提高.
引用
收藏
页码:867 / 872+878 +878
页数:7
相关论文
共 2 条
[1]   基于高阶统计特征实值阴性克隆选择算法的轴承故障检测 [J].
陶新民 ;
杜宝祥 ;
徐勇 .
机械工程学报, 2008, (07) :230-236
[2]   不均衡数据集中基于Adaboost的过抽样算法 [J].
韩慧 ;
王文渊 ;
毛炳寰 .
计算机工程, 2007, (10) :207-209