学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
基于MapReduce的Kmeans并行算法及改进
被引:11
作者
:
论文数:
引用数:
h-index:
机构:
衣治安
论文数:
引用数:
h-index:
机构:
王月
机构
:
[1]
东北石油大学计算机与信息技术学院
来源
:
计算机系统应用
|
2015年
/ 24卷
/ 06期
关键词
:
Map Reduce;
k-means算法;
canopy算法;
并行计算;
聚类;
D O I
:
暂无
中图分类号
:
TP311.13 [];
学科分类号
:
摘要
:
针对传统kmeans聚类算法在处理海量数据时所面临的内存不足、运算速度慢等问题,提出了一种基于Map Reduce的Kmeans并行算法,同时为了改善kmeans算法在初始值确定方面的盲目性,采用canopy算法进行改进.实验结果表明,基于Map Reduce的Kmeans并行算法和改进后的算法均能产生良好的聚类效果,不仅提高了聚类质量,而且在处理大数据集方面,改进后的算法的还能够得到趋近于线性的加速比.
引用
收藏
页码:188 / 192
页数:5
相关论文
共 6 条
[1]
K-means算法研究综述
[J].
论文数:
引用数:
h-index:
机构:
吴夙慧
;
论文数:
引用数:
h-index:
机构:
成颖
;
郑彦宁
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学技术信息研究所
南京大学信息管理系
郑彦宁
;
论文数:
引用数:
h-index:
机构:
潘云涛
.
现代图书情报技术,
2011,
(05)
:28
-35
[2]
MapReduce:新型的分布式并行计算编程模型
[J].
论文数:
引用数:
h-index:
机构:
李成华
;
论文数:
引用数:
h-index:
机构:
张新访
;
论文数:
引用数:
h-index:
机构:
金海
;
论文数:
引用数:
h-index:
机构:
向文
.
计算机工程与科学,
2011,
33
(03)
:129
-135
[3]
基于MapReduce模型的并行科学计算
[J].
论文数:
引用数:
h-index:
机构:
郑启龙
;
论文数:
引用数:
h-index:
机构:
房明
;
论文数:
引用数:
h-index:
机构:
汪胜
;
论文数:
引用数:
h-index:
机构:
王向前
;
吴晓伟
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学技术大学计算机科学技术学院
安徽省高性能计算重点实验室
中国科学技术大学计算机科学技术学院
吴晓伟
;
论文数:
引用数:
h-index:
机构:
王昊
.
微电子学与计算机,
2009,
26
(08)
:13
-17
[4]
一种改进的MapReduce并行编程模型
[J].
论文数:
引用数:
h-index:
机构:
周锋
;
论文数:
引用数:
h-index:
机构:
李旭伟
.
科协论坛(下半月),
2009,
(02)
:65
-66
[5]
MapReduce.[J].Jeffrey Dean;Sanjay Ghemawat.Communications of the ACM.2008, 1
[6]
Note on: An improved algorithm for the packing of unequal circles within a larger containing circle
[J].
论文数:
引用数:
h-index:
机构:
Huang, Wenqi
;
Chen, Mao
论文数:
0
引用数:
0
h-index:
0
机构:
Huazhong Univ Sci & Technol, Sch Comp Sci & Technol, Wuhan 430074, Peoples R China
Huazhong Univ Sci & Technol, Sch Comp Sci & Technol, Wuhan 430074, Peoples R China
Chen, Mao
.
COMPUTERS & INDUSTRIAL ENGINEERING,
2006,
50
(03)
:338
-344
←
1
→
共 6 条
[1]
K-means算法研究综述
[J].
论文数:
引用数:
h-index:
机构:
吴夙慧
;
论文数:
引用数:
h-index:
机构:
成颖
;
郑彦宁
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学技术信息研究所
南京大学信息管理系
郑彦宁
;
论文数:
引用数:
h-index:
机构:
潘云涛
.
现代图书情报技术,
2011,
(05)
:28
-35
[2]
MapReduce:新型的分布式并行计算编程模型
[J].
论文数:
引用数:
h-index:
机构:
李成华
;
论文数:
引用数:
h-index:
机构:
张新访
;
论文数:
引用数:
h-index:
机构:
金海
;
论文数:
引用数:
h-index:
机构:
向文
.
计算机工程与科学,
2011,
33
(03)
:129
-135
[3]
基于MapReduce模型的并行科学计算
[J].
论文数:
引用数:
h-index:
机构:
郑启龙
;
论文数:
引用数:
h-index:
机构:
房明
;
论文数:
引用数:
h-index:
机构:
汪胜
;
论文数:
引用数:
h-index:
机构:
王向前
;
吴晓伟
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学技术大学计算机科学技术学院
安徽省高性能计算重点实验室
中国科学技术大学计算机科学技术学院
吴晓伟
;
论文数:
引用数:
h-index:
机构:
王昊
.
微电子学与计算机,
2009,
26
(08)
:13
-17
[4]
一种改进的MapReduce并行编程模型
[J].
论文数:
引用数:
h-index:
机构:
周锋
;
论文数:
引用数:
h-index:
机构:
李旭伟
.
科协论坛(下半月),
2009,
(02)
:65
-66
[5]
MapReduce.[J].Jeffrey Dean;Sanjay Ghemawat.Communications of the ACM.2008, 1
[6]
Note on: An improved algorithm for the packing of unequal circles within a larger containing circle
[J].
论文数:
引用数:
h-index:
机构:
Huang, Wenqi
;
Chen, Mao
论文数:
0
引用数:
0
h-index:
0
机构:
Huazhong Univ Sci & Technol, Sch Comp Sci & Technol, Wuhan 430074, Peoples R China
Huazhong Univ Sci & Technol, Sch Comp Sci & Technol, Wuhan 430074, Peoples R China
Chen, Mao
.
COMPUTERS & INDUSTRIAL ENGINEERING,
2006,
50
(03)
:338
-344
←
1
→