IncLOF:动态环境下局部异常的增量挖掘算法

被引:34
作者
杨风召
朱扬勇
施伯乐
机构
[1] 南京财经大学电子商务实验室
[2] 复旦大学计算机与信息技术系
关键词
数据挖掘; 异常检测; 局部异常因子; 局部可达密度; 增量挖掘算法;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
异常检测是数据挖掘领域研究的最基本的问题之一 ,它在欺诈甄别、贷款审批、气象预报、客户分类等方面有广泛的应用 以前的异常检测算法只适应于静态环境 ,在数据更新时需要进行重新计算 在基于密度的局部异常检测算法LOF的基础上 ,提出一种在动态环境下局部异常挖掘的增量算法IncLOF ,当数据库中的数据更新时 ,只对受到影响的点进行重新计算 ,这样可以大大提高异常的挖掘速度 实验表明 ,在动态环境下IncLOF的运行时间远远小于LOF的运行时间 ,并且用户定义的邻域中的最小对象个数与记录数之比越小 ,效果越明显
引用
收藏
页码:477 / 484
页数:8
相关论文
共 7 条
[1]  
RNgAlgorithmsforminingdistance basedoutliersinlargedatasets. EKnorr. The24thInt’’lConfonVeryLargeDataBases . 1998
[2]  
OutliersinStatisticalData. VBarnett,TLewis. . 1994
[3]  
TheX tree:Anin dexstructureforhigh dimensionaldata. SBerchthold,DKeim,HansPeterKriegel. The22ndConfonVeryLargeDataBases . 1996
[4]  
Incrementalcluster ingformininginadatawarehousingenvironment. MEster,HansPeterKriegel,JSanderetal. The24thInt’’lConfonVeryLargeDataBases . 1998
[5]  
RNgetalLOF :Identifyingdensity basedlocaloutliers. MBreunig,HansPeterKriegel. TheACMSIGMOD 2000Int’’lConfonManagementofData . 2000
[6]  
Alinearmethodfordeviationdetectioninlargedatabases. RAgrawal,PRagaran. Procofthe2ndInt’’lConfonKnowledgeDis coveryandDataMining . 1996
[7]  
Efficientalgorithmsformin ingoutliersfromlargedatasets. SRamaswamy,,RRastogi,,KShim. TheACMSIGMOD 2000Int’’lConfonManagementofData . 2000