基于距离的孤立点检测及其应用

被引:21
作者
陆声链
林士敏
机构
[1] 广西师范大学数学与计算机科学学院
[2] 广西师范大学数学与计算机科学学院 桂林
[3] 桂林
关键词
孤立点检测; 孤立点; 数据标准化;
D O I
暂无
中图分类号
TP311.6 [];
学科分类号
081202 ; 0835 ;
摘要
孤立点检测是一个有趣的知识发现任务,文章介绍了基于距离的孤立点检测及其相关概念,分析了几种有代表性的算法。最后,文章给出了一个判定孤立点的新的定义,并按此定义进行了检测算法,用实际数据进行了实验。实验结果表明,新的定义不仅与DB(p,d)孤立点定义有着相同的结果,而且简化了孤立点检测对用户的需求,同时给出了数据对象在数据集中的孤立程度。
引用
收藏
页码:94 / 97
页数:4
相关论文
共 9 条
[1]  
Shim[P]. HARTIN GREG.中国专利:USD423909S,2000-05-02
[2]  
Mining Distance-Based Outliers in Near Linear Time with Randomization and a Simple Pruning Rule. S.D.Bay,M.Schwabacher. . 2003
[3]  
NHLdata. http:∥moo.hawaii,edu:1749/hockey/hock ey.html .
[4]  
FastOutlierDetectioninHighDimensionalSpaces. F .Angiulli,C .Pizzuti. ProccedingsoftheSixthEuropeanConferenceonthePrinciplesofDataMiningandKnowl edgsDiscovery . 2002
[5]  
OutlierDetectionfortheQualityAssessmentofDataSets. L .Grossi. http:∥europa.eu.int/en/comm/eurostat/re search/conferences/ntts-98/agenda.htm .
[6]  
InformalIdenti ficationofOutliersinMedicalData. J .LauriKKala,M .Juhola,E .Kentala. 5thInternationalWorkshoponIntelligentDataAnalysisinMedicineandPharmacology, (IDAMAP - 2000) .
[7]  
AUnifyingFrameworkforDetectingOutliersandChangePointsfromNon-Station aryTimeSeriesData. K .Yamanishi,J.Takeuchi. SIGKDD’’02 . 2002
[8]  
Distance-BasedOutliers:AlgorithmsandApplications. E .M .Knorr,R .T .Ng,V .Tucakov. VLDBJournal:VeryLargeDatabases . 2000
[9]  
Outlier Detection for High Dimensional Data. C.C.Aggarwal and P.S.Yu. . 2001