基于ν-SVM的不平衡数据挖掘研究

被引:13
作者
郑恩辉 [1 ]
许宏 [1 ]
李平 [2 ]
宋执环 [2 ]
机构
[1] 中国计量学院机电工程学院
[2] 浙江大学工业控制技术国家重点实验室
关键词
不平衡数据; 有偏分类器; 支持向量机;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
摘要
针对基于精度的现有分类算法对不平衡数据挖掘表现出“有偏性”,即正例样本的分类和预测性能差于反例样本的分类和预测性能,基于-νSVM及其启发,提出支持向量数和边界支持向量数的界,进而提出支持向量率和边界支持向量率的界,并把这些界分别扩展到正例和反例.在此基础上,证明了正例的支持向量率和边界支持向量率分别依概率大于反例的支持向量率和边界支持向量率,以及正例的分类性能依概率差于反例的分类性能.针对German credit和Heart disease两个Benchmark数据集的试验研究,验证了本文假设的合理性和上述结论的正确性.
引用
收藏
页码:1682 / 1687
页数:6
相关论文
共 2 条
[1]
一种用于多分类问题的改进支持向量机 [J].
黄景涛 ;
马龙华 ;
钱积新 .
浙江大学学报(工学版), 2004, (12)
[2]
A tutorial on Support Vector Machines for pattern recognition [J].
Burges, CJC .
DATA MINING AND KNOWLEDGE DISCOVERY, 1998, 2 (02) :121-167