一种有效的高属性维稀疏数据聚类算法

被引:6
作者
赵亚琴
周献中
何新
王建宇
机构
[1] 南京理工大学自动化学院
[2] 南京大学工程管理学院
关键词
稀疏相似度; 等价关系的相似度; 数据压缩; 聚类;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
聚类分析是数据挖掘最常见的技术之一.数据的规模、维数和稀疏性都是制约聚类分析的不同方面.本文提出一种有效的高属性维稀疏数据聚类方法.给出稀疏相似度、等价关系的相似度、广义的等价关系的定义.基于对象间的稀疏相似度和等价关系原理形成初始等价类.通过等价关系的相似度修正初始等价关系.使得最终聚类结果更合理.该算法聚类过程不依赖于输入样本的排列顺序.高维稀疏数据的有效压缩提高算法在维数较高时的执行效率.适合于高维稀疏数据的聚类分析.
引用
收藏
页码:289 / 294
页数:6
相关论文
共 6 条
[1]   高属性维稀疏数据聚类回归逻辑神经网络模型及学习算法 [J].
周永权 ;
焦李成 .
电子学报, 2004, (08) :1342-1345
[2]   粗糙集理论中概念与运算的信息表示 [J].
苗夺谦 ;
王珏 .
软件学报, 1999, (02) :2-5
[3]  
高维稀疏聚类知识发现[M]. 冶金工业出版社 , 武森等著, 2003
[4]  
数据挖掘[M]. 机械工业出版社 , (加)JiaweiHan, 2001
[5]  
DataMining:Concepts andTechniques .2 HanJ,KambrM. . 2001
[6]  
Dealing with Relatively Proximity by Rough Clustering .2 Hirano S,Tsumoto S. Proc of the 22nd International Conference of the North American Fuzzy Information Processing Society . 2003