基于k均值分区的数据流离群点检测算法

被引:18
作者
倪巍伟
陆介平
陈耿
孙志挥
机构
[1] 东南大学计算机科学与工程学院
基金
高等学校博士学科点专项科研基金;
关键词
数据挖掘; 离群点检测; 均值参考点; 聚合;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
离群知识发现是数据挖掘研究的一个重要方面,数据流离群点挖掘更因其挖掘对象具有动态性、不可复读性、数据量大等特点而成为离群知识发现研究的一个难点.提出一种基于k均值分区的流数据离群点发现算法,先对数据流进行分区做k均值聚类生成中间聚类结果(均值参考点集),随后在这些均值参考点中,根据离群点的定义找出可能存在的离群点.理论分析和实验结果表明,算法可以有效解决数据流离群点检测问题,算法是有效可行的.
引用
收藏
页码:1639 / 1643
页数:5
相关论文
empty
未找到相关数据