使用聚类稳定性分析方法增强单类学习算法

被引:9
作者
刘家辰
苗启广
宋建锋
曹莹
机构
[1] 西安电子科技大学计算机学院
基金
中央高校基本科研业务费专项资金资助;
关键词
单类学习; 离群点分析; 聚类分析; 聚类稳定性; 支持向量数据描述;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
摘要
针对传统单类学习模型对多模态或多密度分布数据描述能力不足的问题,将集成聚类和聚类稳定性分析引入单类学习.首先将确定聚类簇个数与确定聚类簇分布统一到同一个增强单类学习框架中,之后各聚类簇互为正负类分别建起立多个单类分类模型,最后采用最大融合体积方法融合其决策边界.以经典的支持向量数据描述(SVDD)为例,设计了基于集成聚类的稳定支持向量数据描述算法——ECS-SVDD.在标准UCI数据集和一个真实恶意程序行为数据集上的实验结果表明,ECS-SVDD的性能较单个支持向量数据描述及同类单类学习方法更优.该方法可直接推广到其他最小包含体积集合类型的单类学习算法上,以增强单类学习算法处理多模态和多密度分布数据的能力.
引用
收藏
页码:58 / 64+121 +121
页数:8
相关论文
共 8 条
  • [1] 动态网络桥系数增量聚类算法
    王玙
    高琳
    [J]. 西安电子科技大学学报, 2013, 40 (01) : 30 - 35
  • [2] 增强型单类支持向量机
    冯爱民
    薛晖
    刘学军
    陈松灿
    杨明
    [J]. 计算机研究与发展, 2008, (11) : 1858 - 1864
  • [3] Outlier ensembles[J] . Charu C. Aggarwal. ACM SIGKDD Explorations Newsletter . 2013 (2)
  • [4] Patient classification as an outlier detection problem: An application of the One-Class Support Vector Machine[J] . Neuroimage . 2011 (3)
  • [5] Clusterer ensemble
    Zhou, ZH
    Tang, W
    [J]. KNOWLEDGE-BASED SYSTEMS, 2006, 19 (01) : 77 - 83
  • [6] Support vector data description
    Tax, DMJ
    Duin, RPW
    [J]. MACHINE LEARNING, 2004, 54 (01) : 45 - 66
  • [7] Estimating the support of a high-dimensional distribution
    Schölkopf, B
    Platt, JC
    Shawe-Taylor, J
    Smola, AJ
    Williamson, RC
    [J]. NEURAL COMPUTATION, 2001, 13 (07) : 1443 - 1471
  • [8] Cluster Analysis .2 EVERITT B S,LANDAU S,LEESE M,et al. Wiley . 2011