一种基于相似度概率的不确定分类数据聚类算法

被引:9
作者
张新猛
蒋盛益
机构
[1] 广东外语外贸大学思科信息学院
关键词
不确定数据; 分类数据; 数据挖掘; 聚类;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
摘要
针对不确定分类数据,基于Squeezer算法提出一种有效的不确定数据聚类算法:USqueezer算法。该算法先计算一个不确定分类数据与每个簇的相似度概率和,选取最大的相似度和给定的阈值相比较,若大于阈值,将不确定数据划分到该簇中,否则创建一个新簇。实验表明,USqueezer算法能够有效地进行不确定分类数据的聚类,并且占用较少的运行内存空间和运行时间。
引用
收藏
页码:12 / 16
页数:5
相关论文
共 4 条
[1]
文本分类中一种新的特征选择方法 [J].
王法波 ;
许信顺 .
山东大学学报(工学版), 2010, 40 (04) :8-11+18
[2]
不确定性数据管理技术研究综述 [J].
周傲英 ;
金澈清 ;
王国仁 ;
李建中 .
计算机学报, 2009, 32 (01) :1-16
[3]
基于聚类的入侵检测算法研究.[M].蒋盛益; 编著.科学出版社.2008,
[4]
Squeezer: An efficient algorithm for clustering categorical data [J].
He, ZY ;
Xu, XF ;
Deng, SC .
JOURNAL OF COMPUTER SCIENCE AND TECHNOLOGY, 2002, 17 (05) :611-624