基于人工免疫系统的数据简化

被引:10
作者
公茂果
郝琳
焦李成
王晓华
孙奕菲
机构
[1] 西安电子科技大学智能信息处理研究所智能感知与图像理解教育部重点实验室
关键词
克隆选择; 数据简化; 实例选择; 人工免疫系统; 进化计算;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
针对数据简化中的实例选择问题,基于抗体克隆选择学说提出了一种免疫克隆数据简化算法.利用马尔可夫理论证明了该算法能以概率1收敛.通过对7个具有代表性的标准UCI数据集的简化实验证明了该算法的有效性.通过实验分析了权值参数λ的取值变化对算法性能的影响,确定了其最佳取值区间.针对海量数据集简化时算法收敛较慢的问题,引入分层编码策略.通过对7个大规模及海量数据集的简化实验表明了在进化代数不变的情况下,新的编码方式能够极大地提高算法的收敛速度,得到更为理想的结果.通过对Letter和DNA两个数据集的实验给出了分层编码中层数t的最佳取值区间.
引用
收藏
页码:804 / 814
页数:11
相关论文
共 5 条
[1]  
免疫优化计算、学习与识别[M]. - 科学出版社 , 焦李成[等]著, 2006
[2]   On issues of instance selection [J].
Liu, H ;
Motoda, H .
DATA MINING AND KNOWLEDGE DISCOVERY, 2002, 6 (02) :115-130
[3]   INSTANCE-BASED LEARNING ALGORITHMS [J].
AHA, DW ;
KIBLER, D ;
ALBERT, MK .
MACHINE LEARNING, 1991, 6 (01) :37-66
[4]  
An efficient subspace sampling framework for high-dimensional data reduction,selectivity estimation,and nearest-neighbor search .2 Charu CA. IEEE Trans.on Knowledge and Data Engineering . 2004
[5]  
Instance pruning techniques .2 Wilson DR,Martinez TR. Proc.of the14th Int’l Conf.on Machine Learning . 1997