共 1 条
基于局部信息熵的加权子空间离群点检测算法
被引:27
作者:
倪巍伟
[1
]
陈耿
[2
]
陆介平
[3
]
吴英杰
[1
]
孙志挥
[1
]
机构:
[1] 东南大学计算机科学与工程学院
[2] 南京审计学院审计信息工程实验室
[3] 江苏省镇江市科技局
来源:
基金:
高等学校博士学科点专项科研基金;
关键词:
高维数据;
离群点检测;
信息熵;
子空间挖掘;
权向量;
D O I:
暂无
中图分类号:
TP311.13 [];
学科分类号:
1201 ;
摘要:
离群点检测作为数据挖掘的一个重要研究方向,可以从大量数据中发现少量与多数数据有明显区别的数据对象."维度灾殃"现象的存在使得很多已有的离群点检测算法对高维数据不再有效.针对这一问题,提出基于局部信息熵的加权子空间离群点检测算法SPOD.通过对数据对象在各维进行邻域信息熵分析,生成数据对象相应的离群子空间和属性权向量,对离群子空间中的属性赋以较高的权值,进一步提出子空间加权距离等概念.采用基于密度离群点检测的思想,分析计算数据对象的子空间离群影响因子,判断是否为离群点.算法能够有效地适应于高维数据离群点检测,理论分析和实验结果表明算法是有效可行的.
引用
收藏
页码:1189 / 1194
页数:6
相关论文