2v-SSPC—一种不平衡数据分类方法

被引:2
作者
薛贞霞 [1 ,2 ]
刘三阳 [1 ]
刘万里 [1 ,3 ]
机构
[1] 西安电子科技大学应用数学系
[2] 河南科技大学数学系
[3] 洛阳师范学院数学系
关键词
模式识别; 分类算法; 不平衡数据; 参数选择; 超球面;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
针对现有分类算法通常对不平衡数据挖掘表现出有偏性,即正类样本(通常是更重要的一类)的分类和预测性能差于负类样本的分类和预测性能,提出一种不平衡数据分类方法。该方法通过一个超球面将两类数据以最大分离比率分离,并且引入两个参数来分别控制两类错分率的上界,不仅提高了不平衡数据集的分类和预测的性能,而且大大缩小了参数的选择范围。在UCI真实数据上进行了实验,并采用ROC曲线下面积作为评估指标进行比较,结果验证了该方法的有效性。
引用
收藏
页码:2471 / 2476
页数:6
相关论文
共 3 条
[1]   基于乘性规则的支持向量域分类器 [J].
陆从德 ;
张太镒 ;
胡金燕 .
计算机学报, 2004, (05) :690-694
[2]   样本数目不对称时的SVM模型 [J].
肖健华 ;
吴今培 .
计算机科学, 2003, (02) :165-167
[3]   The use of the area under the roc curve in the evaluation of machine learning algorithms [J].
Bradley, AP .
PATTERN RECOGNITION, 1997, 30 (07) :1145-1159