共 3 条
2v-SSPC—一种不平衡数据分类方法
被引:2
作者:
薛贞霞
[1
,2
]
刘三阳
[1
]
刘万里
[1
,3
]
机构:
[1] 西安电子科技大学应用数学系
[2] 河南科技大学数学系
[3] 洛阳师范学院数学系
来源:
关键词:
模式识别;
分类算法;
不平衡数据;
参数选择;
超球面;
D O I:
暂无
中图分类号:
TP181 [自动推理、机器学习];
学科分类号:
081104 ;
0812 ;
0835 ;
1405 ;
摘要:
针对现有分类算法通常对不平衡数据挖掘表现出有偏性,即正类样本(通常是更重要的一类)的分类和预测性能差于负类样本的分类和预测性能,提出一种不平衡数据分类方法。该方法通过一个超球面将两类数据以最大分离比率分离,并且引入两个参数来分别控制两类错分率的上界,不仅提高了不平衡数据集的分类和预测的性能,而且大大缩小了参数的选择范围。在UCI真实数据上进行了实验,并采用ROC曲线下面积作为评估指标进行比较,结果验证了该方法的有效性。
引用
收藏
页码:2471 / 2476
页数:6
相关论文