基于共享反K近邻的局部离群点检测算法

被引:6
作者
潘章明
陈尹立
机构
[1] 广东金融学院计算机科学与技术系
关键词
局部离群点检测; 近邻; 共享近邻; 聚类;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
离群点检测和分析离群模式隐含的特征是离群点挖掘的重要研究内容。现有离群点检测算法存在两个明显的不足:根据离群度检测离群点,难以确定离群点的数量;忽略了与离群点邻接的聚类信息,不能提供解析离群模式的有效证据。为此,提出一种基于共享反K近邻的离群点检测算法,首先定义了一种对密度和维数变化不敏感的共享反K近邻相似度,然后应用聚类方法将数据集划分为聚类簇和包含离群点的离群簇,从而获取数据集中的离群点及解析离群点的聚类结构。仿真结果表明,反K近邻算法比现有方法更能精确地检测数据集中的局部离群点,具有很好的控制性能。
引用
收藏
页码:269 / 273
页数:5
相关论文
共 8 条
  • [1] Distance-based outliers: algorithms and applications[J] . Edwin M. Knorr,Raymond T. Ng,Vladimir Tucakov. &nbspThe VLDB Journal . 2000 (3-4)
  • [2] Finding clusters ofdifferent sizes,shapes,and densities in noisy,highdimensional data. Ertoz L,Michael S,Kumar V. Proceedings of the third SIAMInternational Conference on Data Mining (SIAM2003) . 2003
  • [3] Data mining:Concepts andtechniques. Jiawei H,Micheline K. . 2006
  • [4] Reverse kNN Search in Arbitrary Di-mensionality. Y Tao,D Papadias,X Lian. Proc.of the 30th International Conference onVery Large Data Bases . 2004
  • [5] LOF: identifying density-based local outliers. Breunig MM,Kreigel HP,Ng RT,et al. Proceedings of ACM SIGMOD International Conference on Management of Data . 2000
  • [6] 基于k-近邻算法的定位方法设计和仿真
    李文杰
    李文明
    [J]. 计算机仿真, 2009, 26 (04) : 194 - 196+351
  • [7] 离群点挖掘方法综述
    薛安荣
    姚林
    鞠时光
    陈伟鹤
    马汉达
    [J]. 计算机科学, 2008, (11) : 13 - 18+27
  • [8] 一种新的求解度约束最小生成树的遗传算法
    来卫国
    李鸥
    程军
    [J]. 计算机仿真, 2008, (08) : 162 - 165