基于直方图和FP增长的高维空间离群点挖掘

被引:2
作者
李龙姣
程国达
机构
[1] 南京财经大学信息工程学院
关键词
数据挖掘; KNN距离; 直方图; FP增长; 离群维关联;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
高维空间离群点的检测和分析是数据挖掘的研究难点之一,针对现有方法存在的问题,提出基于直方图和FP增长的高维空间离群点的挖掘方法。该方法首先计算每一维上数据点的KNN(K-Nearest Neighbors)距离,形成直方图,利用直方图判定数据每一维上的离群点,然后用FP增长算法挖掘频繁离群维之间的关联规则,用于解释离群点在离群维之间的关系。实验证明所提方法不仅有效,而且具有实际意义。
引用
收藏
页码:47 / 52
页数:6
相关论文
共 19 条
  • [1] Distance-based detection and prediction of outliers. ANGIULLI F,BASTA S,PIZZUTI C. IEEE Transactions on Knowledge and Data Engineering . 2006
  • [2] 基于粗糙集的高维空间离群点发现算法研究
    许龙飞
    熊君丽
    不详
    [J]. 计算机工程与应用 , 2004, (07) : 58 - 60+77
  • [3] Risk Analysis for Large Projects: Models, Methods and Cases. Chapman CB,Cooper DF. . 1987
  • [4] Outlier detection for high dimensional data. Aggarwal CC,Yu P. Proceedings of the ACM SIGMOD International Conference on Management of Data . 2001
  • [5] 离群点挖掘方法综述
    薛安荣
    姚林
    鞠时光
    陈伟鹤
    马汉达
    [J]. 计算机科学, 2008, (11) : 13 - 18+27
  • [6] LOF: identifying density-based local outliers. Breunig M M,Kreigel H P,Ng R T,et al. Proceedings of the 2000 ACM SIGMOD International Conference on Management of Data . 2000
  • [7] A genetic approach for efficient outlier detection in projected space. Bandyopadhyay S,Santra S. Pattern Recognition . 2008
  • [8] Outlier Mining in Large High-Dimensional Data Sets. Fabrizio Angiulli,Clara Pizzuti. IEEE Transaction On Knowledge And Data Engineer . 2005
  • [9] Re-designing Distance Functions and Distance-based Applications for High Dimensional Data. Aggarwal C C. SIGMOD Re-cord Date . 2001
  • [10] Data clustering[J] . A. K. Jain,M. N. Murty,P. J. Flynn. &nbspACM Computing Surveys (CSUR) . 1999 (3)