面向CPU/MIC异构架构的K-Means向量化算法

被引:4
作者
谭郁松
伍复慧
吴庆波
陈微
孙晓利
机构
[1] 国防科学技术大学计算机学院
基金
高等学校博士学科点专项科研基金;
关键词
K-Means; 向量优化; 集成众核(MIC); 异构;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
在大数据背景下,以K-Means为代表的聚类分析对于数据分析和挖掘十分重要。海量高维数据的处理给K-Means算法带来了性能方面的强烈需求。最新提出的众核体系结构MIC(many integrated core)能够为算法加速提供众核间线程级和核内指令级并行,使其成为K-Means算法加速的很好选择。在分析K-Means基本算法特点的基础上,分析了K-Means算法的瓶颈,提出了可利用数据并行的K-Means向量化算法,优化了向量化算法的数据布局方案。最后,基于CPU/MIC的异构架构实现了向量化K-Means算法,并且探索了MIC在非传统HPC(high performance computing)应用领域的优化策略。测试结果表明,K-Means向量化算法具有良好的计算性能和扩展性。
引用
收藏
页码:641 / 652
页数:12
相关论文
共 5 条
[1]   NP-hardness of Euclidean sum-of-squares clustering [J].
Aloise, Daniel ;
Deshpande, Amit ;
Hansen, Pierre ;
Popat, Preyas .
MACHINE LEARNING, 2009, 75 (02) :245-248
[2]   A performance study of general-purpose applications on graphics processors using CUDA [J].
Che, Shuai ;
Boyer, Michael ;
Meng, Jiayuan ;
Tarjan, David ;
Sheaffer, Jeremy W. ;
Skadron, Kevin .
JOURNAL OF PARALLEL AND DISTRIBUTED COMPUTING, 2008, 68 (10) :1370-1380
[3]  
MapReduce[J] . Jeffrey Dean,Sanjay Ghemawat. Communications of the ACM . 2008 (1)
[4]  
Top 10 algorithms in data mining[J] . Xindong Wu,Vipin Kumar,J. Ross Quinlan,Joydeep Ghosh,Qiang Yang,Hiroshi Motoda,Geoffrey J. McLachlan,Angus Ng,Bing Liu,Philip S. Yu,Zhi-Hua Zhou,Michael Steinbach,David J. Hand,Dan Steinberg. Knowledge and Information Systems . 2009 (1)
[5]   Unsupervised Learning [J].
Barlow, H. B. .
NEURAL COMPUTATION, 1989, 1 (03) :295-311