局部离群点挖掘算法研究

被引:218
作者
薛安荣
鞠时光
何伟华
陈伟鹤
机构
[1] 江苏大学计算机科学与通信工程学院
[2] 江苏大学计算机科学与通信工程学院 江苏镇江
关键词
离群点检测; 局部离群系数; R-树; 数据挖掘; 空间离群点; 剔除平均;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
080201 [机械制造及其自动化];
摘要
离群点可分为全局离群点和局部离群点.在很多情况下,局部离群点的挖掘比全局离群点的挖掘更有意义.现有的基于局部离群度的离群点挖掘算法存在检测精度依赖于用户给定的参数、计算复杂度高等局限.文中提出将对象属性分为固有属性和环境属性,用环境属性确定对象邻域、固有属性计算离群度的方法克服上述局限;并以空间数据为例,将空间属性与非空间属性分开,用空间属性确定空间邻域,用非空间属性计算空间离群度,设计了空间离群点挖掘算法.实验结果表明,所提算法具有对用户依赖性少、检测精度高、可伸缩性强和运算效率高的优点.
引用
收藏
页码:1455 / 1463
页数:9
相关论文
共 2 条
[1]
SLOM: a new measure for local spatial outliers[J] Sanjay Chawla;Pei Sun Knowledge and Information Systems 2006,
[2]
Identification of outliers Hawkins;D; London:Chapman and Hall 1980,