基于层次聚类的孤立点检测方法

被引:4
作者
梁斌梅
机构
[1] 广西大学数学与信息科学学院
关键词
孤立点检测; 层次聚类; 数据预处理; 数据挖掘;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
孤立点检测是数据挖掘过程的重要环节,提出了基于层次聚类的孤立点检测(ODHC)方法。ODHC方法基于层次聚类结果进行分析,对距离矩阵按簇间距离从大到小检测孤立点,可检测出指定离群程度的孤立点,直到达到用户对数据的集中性要求。该方法适用于多维数据集,且算法原理直观,用户友好,对孤立点的检测准确率较高。在iris、balloon等数据集上的仿真实验结果表明,ODHC方法能有效地识别孤立点,是一种简单实用的孤立点检测方法。
引用
收藏
页码:117 / 119
页数:3
相关论文
共 4 条
[1]   基于凝聚的层次聚类算法的改进 [J].
石剑飞 ;
闫怀志 ;
牛占云 .
北京理工大学学报, 2008, (01) :66-69
[2]   基于距离的孤立点检测研究 [J].
陆声链 ;
林士敏 ;
不详 .
计算机工程与应用 , 2004, (33) :73-75+94
[3]  
数据仓库与数据挖掘.[M].武森等著;.冶金工业出版社.2003,
[4]  
数据挖掘.[M].(加)JiaweiHan;(加)MichelineKamber著;范明;孟小峰等译;.机械工业出版社.2001,