基于边界和距离的离群点检测

被引:24
作者
江峰 [1 ]
杜军威 [1 ]
眭跃飞 [2 ]
曹存根 [2 ]
机构
[1] 青岛科技大学信息与科学技术学院
[2] 中国科学院计算技术研究所
关键词
数据挖掘; 离群点检测; 粗糙集; 不确定与不完整数据;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
近年来,离群点检测已经引起人们的广泛关注.离群点检测在网络入侵检测、信用卡欺诈、电子商务犯罪、医疗诊断以及反恐等诸多领域都具有十分重要的作用.离群点检测的目的是为了发现数据集中的一小部分对象,与数据集中其余的大部分对象相比,这一小部分对象有着特殊的行为或者具有反常的属性.针对现有的离群点检测方法不能有效处理不确定与不完整数据的问题,本文将粗糙集中边界的概念与Knorr等所提出的基于距离的离群点检测方法结合在一起,在粗糙集的框架中提出一种新的离群点定义与检测方法.针对于该方法,我们设计出相应的离群点检测算法BDOD,并且通过在临床诊断数据集上所进行的实验,验证了算法BDOD的有效性.实验结果表明本文的方法为处理离群点检测中的不确定与不完整数据问题提供了一条新的途径.
引用
收藏
页码:700 / 705
页数:6
相关论文
共 5 条
[1]   不一致决策系统中约简之间的比较 [J].
邓大勇 ;
黄厚宽 ;
李向军 .
电子学报, 2007, (02) :252-255
[2]   一种新的基于模糊聚类和免疫原理的入侵监测模型 [J].
陶新民 ;
陈万海 ;
郭黎利 .
电子学报, 2006, (07) :1329-1332
[3]   分布式异常检测中隐私保持问题研究 [J].
黄毅群 ;
卢正鼎 ;
胡和平 ;
李瑞轩 .
电子学报, 2006, (05) :796-799
[4]  
Rough集及Rough推理[M]. 科学出版社 , 刘清著, 2001
[5]  
Distance-based outliers: algorithms and applications[J] . Edwin M. Knorr,Raymond T. Ng,Vladimir Tucakov.The VLDB Journal . 2000 (3-4)