分类属性高维数据基于集合差异度的聚类算法

被引:2
作者
武森
魏桂英
白尘
张桂琼
机构
[1] 北京科技大学经济管理学院
关键词
聚类; 高维空间; 集合; 差异度; 数据挖掘;
D O I
10.13374/j.issn1001-053x.2010.08.045
中图分类号
TP311.13 [];
学科分类号
摘要
提出基于集合差异度的聚类算法.算法通过定义的集合差异度和集合精简表示,直接进行一个集合内所有对象总体差异程度的计算,而不必计算两两对象间的距离,并且在不影响计算精确度的情况下对分类属性高维数据进行高度压缩,只需一次数据扫描即得到聚类结果.算法计算时间复杂度接近线性.实例表明该算法是有效的.
引用
收藏
页码:1085 / 1089
页数:5
相关论文
共 5 条
[1]
Fast mining of distance-based outliers in high-dimensional datasets [J].
Ghoting, Amol ;
Parthasarathy, Srinivasan ;
Otey, Matthew Eric .
DATA MINING AND KNOWLEDGE DISCOVERY, 2008, 16 (03) :349-364
[2]
A k-mean clustering algorithm for mixed numeric and categorical data [J].
Ahmad, Amir ;
Dey, Lipika .
DATA & KNOWLEDGE ENGINEERING, 2007, 63 (02) :503-527
[3]
高维分类属性的子空间聚类算法 [J].
单世民 ;
王新艳 ;
张宪超 .
小型微型计算机系统, 2009, 30 (10) :2016-2021
[4]
复杂网络聚类方法 [J].
杨博 ;
刘大有 ;
金弟 ;
马海宾 .
软件学报, 2009, 20 (01) :54-66
[5]
CABOSFV algorithm for high dimensional sparse data clustering [J].
Wu, S ;
Gao, XD .
JOURNAL OF UNIVERSITY OF SCIENCE AND TECHNOLOGY BEIJING, 2004, 11 (03) :283-288