云计算下的一种数据挖掘算法的研究

被引:4
作者
徐浙君
机构
[1] 浙江邮电职业技术学院
关键词
云计算; 聚类; k值;
D O I
10.13774/j.cnki.kjtb.2018.11.040
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
针对K-means聚类算法中的k值确定给聚类算法效果带来不确定性的问题,本文通过引入多层变量加权概念,提高聚类效果的收敛性,引入改进的非加权组平均法和最大最小距离算法有效的解决k值确定问题,引入Max-Entropy算法解决分布簇内节点分布不均导致的计算问题。仿真实验中,将本文算法的改进的效果进行研究,并结合云计算环境下通过使用本文算法在挖掘的加速比,花费时间上都取得了比较好的效果。
引用
收藏
页码:209 / 215+220 +220
页数:8
相关论文
共 11 条
[1]  
K-Means-Type Algorithms: A Generalized Convergence Theorem and Characterization of Local Optimality. Selim, Shokri Z.,Ismail, M. A. Pattern Analysis and Machine Intelligence, IEEE Transactions on . 1984
[2]  
TW-k-means:Automated two-level variable weightingclustering algorithm for multiview data. Xiaojun Chen,Xiaofei Xu,Yunming Ye. Knowledge and Data Engineering . 2013
[3]  
Cluster validity methods[J] . Maria Halkidi,Yannis Batistakis,Michalis Vazirgiannis. &nbspACM SIGMOD Record . 2002 (2)
[4]   一种基于多维空间超球体的快速聚类算法 [J].
吕宗磊 ;
王建东 .
南京航空航天大学学报, 2006, (06) :706-711
[5]   基于云计算的并行K-means聚类算法研究 [J].
谢雪莲 ;
李兰友 .
计算机测量与控制, 2014, 22 (05) :1510-1512
[6]   基于网格的K-均值聚类分析算法的研究 [J].
赵冬玲 ;
冯艳茹 ;
潘正运 .
科技通报, 2014, 30 (07) :175-178
[7]   基于云环境K-means聚类的并行算法 [J].
高榕 ;
李晶 ;
肖雅夫 ;
祝孙静 ;
彭卫平 .
武汉大学学报(理学版), 2015, 61 (04) :368-374
[8]   基于云自适应遗传算法的K-means聚类分析 [J].
许茂增 ;
余国印 .
数学的实践与认识, 2015, 45 (17) :48-55
[9]   改进模糊聚类的云任务调度算法 [J].
胡蒙 ;
苑迎春 ;
王雪阳 .
计算机工程与设计, 2015, 36 (09) :2437-2441
[10]   云环境下基于数据流的k-means聚类算法 [J].
王飞 ;
秦小麟 ;
刘亮 ;
沈尧 .
计算机科学, 2015, 42 (11) :235-239+265