基于加权距离计算的自适应粗糙K-均值算法

被引:6
作者
孙志鹏
钱雪忠
吴秦
邓杰
机构
[1] 江南大学物联网工程学院
关键词
粗糙集理论; 属性约简; 正态性检验; 高斯分布模型; 聚类分析;
D O I
暂无
中图分类号
TP18 [人工智能理论]; TP311.13 [];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ; 1201 ;
摘要
针对粗糙K-均值算法的执行效率较低和对数据对象的处理不准确问题,提出了基于加权距离计算的自适应粗糙K-均值算法。该算法在粗糙集理论应用的基础上修正数据集合的隶属度函数,结合属性约简方法,根据数据属性对聚类效果的影响因子设置权值,在欧氏距离中引入权值系数来初始化簇的中心点,最后通过K值递增的改进算法对数据集进行正态检验来验证每个簇的数据是否符合高斯分布模型,从而能够自适应地确定K值。实验结果表明,改进后的算法相比原算法能在保证一定执行效率的同时,获得较高的聚类精确度,且对高维数据集也有较强的适应性,从而表明该算法是有效可行的。
引用
收藏
页码:1987 / 1990+1998 +1998
页数:5
相关论文
共 11 条
[1]  
Implementing algorithms of rough set theory and fuzzy rough set theory in the R package “RoughSets”.[J].Lala Septem Riza;Andrzej Janusz;Christoph Bergmeir;Chris Cornelis;Francisco Herrera;Dominik Śle¸zak;José Manuel Benítez.Information Sciences.2014,
[2]   A modified rough c-means clustering algorithm based on hybrid imbalanced measure of distance and density [J].
Zhang, Tengfei ;
Chen, Long ;
Ma, Fumin .
INTERNATIONAL JOURNAL OF APPROXIMATE REASONING, 2014, 55 (08) :1805-1818
[3]  
Interval Set Clustering of Web Users with Rough <Emphasis Type="Italic">K</Emphasis>-Means.[J].Pawan Lingras;Chad West.Journal of Intelligent Information Systems.2004, 1
[4]  
Process monitoring using a Gaussian mixture model via principal component analysis and discriminant analysis.[J].Sang Wook Choi;Jin Hyun Park;In-Beum Lee.Computers and Chemical Engineering.2003, 8
[5]   基于密度期望和有效性指标的K-均值算法 [J].
何云斌 ;
肖宇鹏 ;
万静 ;
李松 .
计算机工程与应用, 2013, 49 (24) :105-111
[6]   自适应特征权重的K-means聚类算法 [J].
李四海 ;
满自斌 .
计算机技术与发展, 2013, 23 (06) :98-101+105
[7]   一种有效的K-means聚类中心初始化方法 [J].
熊忠阳 ;
陈若田 ;
张玉芳 .
计算机应用研究, 2011, 28 (11) :4188-4190
[8]   粗糙模糊C均值融合聚类 [J].
王丹 ;
吴孟达 .
国防科技大学学报, 2011, 33 (03) :145-150
[9]   一种基于粗糙集的K-means聚类算法 [J].
聂映 ;
陈福集 .
武汉大学学报(工学版), 2011, 44 (02) :257-260
[10]   新的K-均值算法最佳聚类数确定方法 [J].
周世兵 ;
徐振源 ;
唐旭清 .
计算机工程与应用, 2010, 46 (16) :27-31