学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
面向大数据处理的并行优化抽样聚类K-means算法
被引:44
作者
:
论文数:
引用数:
h-index:
机构:
周润物
李智勇
论文数:
0
引用数:
0
h-index:
0
机构:
湖南大学信息科学与工程学院
李智勇
论文数:
引用数:
h-index:
机构:
陈少淼
论文数:
引用数:
h-index:
机构:
陈京
李仁发
论文数:
0
引用数:
0
h-index:
0
机构:
湖南大学信息科学与工程学院
李仁发
机构
:
[1]
湖南大学信息科学与工程学院
来源
:
计算机应用
|
2016年
/ 36卷
/ 02期
关键词
:
大数据;
K-均值;
概率抽样;
欧氏距离;
聚类精度;
D O I
:
暂无
中图分类号
:
TP311.13 [];
学科分类号
:
1201 ;
摘要
:
针对大数据环境下K-means聚类算法聚类精度不足和收敛速度慢的问题,提出一种基于优化抽样聚类的K-means算法(OSCK)。首先,该算法从海量数据中概率抽样多个样本;其次,基于最佳聚类中心的欧氏距离相似性原理,建模评估样本聚类结果并去除抽样聚类结果的次优解;最后,加权整合评估得到的聚类结果得到最终k个聚类中心,并将这k个聚类中心作为大数据集聚类中心。理论分析和实验结果表明,OSCK面向海量数据分析相对于对比算法具有更好的聚类精度,并且具有很强的稳健性和可扩展性。
引用
收藏
页码:311 / 315+329 +329
页数:6
相关论文
共 1 条
[1]
K-meansOptimizationAlgorithmforSolvingClusteringProblem.2JinxinDong,MinyongQi.SecondInternationalWorkshoponKnowledgeDiscoveryandDataMining.2009
←
1
→
共 1 条
[1]
K-meansOptimizationAlgorithmforSolvingClusteringProblem.2JinxinDong,MinyongQi.SecondInternationalWorkshoponKnowledgeDiscoveryandDataMining.2009
←
1
→