大数据技术中计算与数据的协作机制

被引:3
作者
王鹏 [1 ]
黄焱 [2 ,3 ]
刘峰 [1 ]
安俊秀 [1 ]
机构
[1] 成都信息工程学院并行计算实验室
[2] 中国科学院成都计算机应用研究所
[3] 中国科学院大学
基金
中国博士后科学基金;
关键词
面向数据; 协作机制; 面向计算; 高性能计算; 大数据;
D O I
10.16836/j.cnki.jcuit.2014.01.001
中图分类号
TP338 [各种电子数字计算机];
学科分类号
摘要
大数据系统也被称为面向数据的高性能计算系统,与传统高性能计算系统相似,其计算和数据存储通常也是基于机群实现的分布式系统。以计算与数据的协作机制为主线分析对比了面向计算的高性能计算和面向数据的高性能计算,指出正是计算与数据的协作机制决定着大数据系统的基本结构和性能。分布式文件系统与计算通过协助机制的融合是大数据系统实现自动并行化的基础。与面向计算的高性能计算系统不同,大数据系统以切分数据并将计算向数据迁移作为协作机制的主要原则,实现对海量数据的自动并行批处理。元数据映射方法、哈希映射方法及流式拓朴方法是实现计算和数据协作的基本方法,特别是利用流式拓朴方法可以实现实时大数据处理。
引用
收藏
页码:1 / 12
页数:12
相关论文
共 8 条
  • [1] 存储系统中的纠删码研究综述
    罗象宏
    舒继武
    [J]. 计算机研究与发展, 2012, 49 (01) : 1 - 11
  • [2] 基于MPI的云计算模型
    郭本俊
    王鹏
    陈高云
    黄健
    [J]. 计算机工程, 2009, 35 (24) : 84 - 86
  • [3] A dynamic and adaptive load balancing strategy for parallel file system with large-scale I/O servers
    Dong, Bin
    Li, Xiuqiao
    Wu, Qimeng
    Xiao, Limin
    Ruan, Li
    [J]. JOURNAL OF PARALLEL AND DISTRIBUTED COMPUTING, 2012, 72 (10) : 1254 - 1268
  • [4] Cloud-DLS: Dynamic trusted scheduling for Cloud computing[J] . Wei Wang,Guosun Zeng,Daizhong Tang,Jing Yao.Expert Systems With Applications . 2011 (3)
  • [5] MapReduce[J] . Jeffrey Dean,Sanjay Ghemawat.Communications of the ACM . 2008 (1)
  • [6] Dryad[J] . Michael Isard,Mihai Budiu,Yuan Yu,Andrew Birrell,Dennis Fetterly.ACM SIGOPS Operating Systems Review . 2007 (3)
  • [7] Load balancing for heterogeneous clusters of PCs
    Bohn, CA
    Lamont, GB
    [J]. FUTURE GENERATION COMPUTER SYSTEMS-THE INTERNATIONAL JOURNAL OF ESCIENCE, 2002, 18 (03): : 389 - 400
  • [8] Web caching with consistent hashing
    Karger, David
    Sherman, Alex
    Berkheimer, Andy
    Bogstad, Bill
    Dhanidina, Rizwan
    Iwamoto, Ken
    Kim, Brian
    Matkins, Luke
    Yerushalmi, Yoav
    [J]. Computer Networks, 1999, 31 (11): : 1203 - 1213