数值型和分类型混合数据的模糊K-Prototypes聚类算法(英文)

被引:33
作者
陈宁
陈安
周龙骧
机构
[1] 中国科学院数学与系统科学研究院!北京
[2] 中国科学院科技政策与管理科学研究所!北京
[3] 中国科学院软件研究所
[4] 北京
关键词
数值型属性; 分类型属性; 确定聚类; 模糊聚类;
D O I
10.13328/j.cnki.jos.2001.08.001
中图分类号
TP301.6 [算法理论];
学科分类号
081202 ;
摘要
由于数据库经常同时包含数值型和分类型的属性 ,因此研究能够处理混合型数据的聚类算法无疑是很重要的 .讨论了混合型数据的聚类问题 ,提出了一种模糊 K- prototypes算法 .该算法融合了 K- means和 K- modes对数值型和分类型数据的处理方法 ,能够处理混合类型的数据 .模糊技术体现聚类的边界特征 ,更适合处理含有噪声和缺失数据的数据库 .实验结果显示 ,模糊算法比相应的确定算法得到的结果准确度高
引用
收藏
页码:1107 / 1119
页数:13
相关论文
共 2 条
[1]   Extensions to the k-means algorithm for clustering large data sets with categorical values [J].
Huang, ZX .
DATA MINING AND KNOWLEDGE DISCOVERY, 1998, 2 (03) :283-304
[2]  
Adaptive fuzzy c-shells clustering and detection of ellipses .2 RN Dave,K Bhaswan. IEEE Transaction on Neural Networks . 1992