一种面向不平衡数据集的核Fisher线性判别分析方法

被引:26
作者
尹军梅
杨明
万建武
机构
[1] 南京师范大学计算机科学与技术学院
[2] 江苏省信息安全保密技术工程研究中心
关键词
不平衡数据集; 核Fisher线性判别分析(KFDA); 过抽样; 欠抽样;
D O I
10.16451/j.cnki.issn1003-6059.2010.03.019
中图分类号
TP181 [自动推理、机器学习];
学科分类号
140502 [人工智能];
摘要
实际应用中,很多分类问题是面向不平衡数据的分类,而不平衡数据集会导致许多分类器的性能下降.文中介绍核Fisher线性判别分析的分类机制,分析不平衡数据导致核Fisher线性判别分析失效的原因,进而提出一种加权核Fisher线性判别分析方法.该方法通过调整两类样本的核协方差矩阵对核类内离散度矩阵的贡献,可克服不平衡数据对分类性能的影响.为进一步测试该方法,对UCI数据集进行实验测试,实验结果表明该方法可有效改进分类器的分类性能.
引用
收藏
页码:414 / 420
页数:7
相关论文
共 7 条
[1]
不均衡数据集中基于Adaboost的过抽样算法 [J].
韩慧 ;
王文渊 ;
毛炳寰 .
计算机工程, 2007, (10) :207-209
[2]
非平衡数据集Fisher线性判别模型 [J].
谢纪刚 ;
裘正定 .
北京交通大学学报, 2006, (05) :15-18
[3]
PC4.5:用于不均衡数据集的C4.5改进算法 [J].
周荃 ;
王崇骏 ;
王王君 ;
陈世福 .
计算机辅助工程, 2006, (03) :23-26
[4]
样本数目不对称时的SVM模型 [J].
肖健华 ;
吴今培 .
计算机科学, 2003, (02) :165-167
[5]
模式识别中广义核函数Fisher最佳鉴别 [J].
甘俊英 ;
张有为 .
模式识别与人工智能, 2002, 15 (04) :429-434
[6]
Cost-sensitive boosting for classification of imbalanced data [J].
Sun, Yamnin ;
Kamel, Mohamed S. ;
Wong, Andrew K. C. ;
Wang, Yang .
PATTERN RECOGNITION, 2007, 40 (12) :3358-3378
[7]
Machine Learning for the Detection of Oil Spills in Satellite Radar Images [J].
Miroslav Kubat ;
Robert C. Holte ;
Stan Matwin .
Machine Learning, 1998, 30 :195-215