分布式系统中的检查点算法

被引:12
作者
魏晓辉
鞠九滨
机构
[1] 吉林大学计算机科学系!长春
关键词
检查点; 分布式程序; 异步检查点算法; 一致检查点算法;
D O I
暂无
中图分类号
TP301 [理论、方法];
学科分类号
081202 ;
摘要
检查点能够保存和恢复程序的运行状态.它在进程迁移、容错、卷回调试等领域都有重要的应用.本文对分布式系统中的检查点算法进行了详细的分类评述.检查点算法可分为单进程和分布式程序检查点算法,分布式程序检查点算法又可分为异步检查点算法和一致检查点算法.同时本文系统介绍了改进检查点算法性能的典型方法.这些改进算法主要采用两个策略来减少算法的开销与延迟:一是减少检查点文件中需要存储的信息量,如增量算法等;二是提高检查点操作与目标程序运行的并行性,如主存算法等.最后,文章讨论了目前检查点算法的局限性和进一步的工作.
引用
收藏
页码:367 / 375
页数:9
相关论文
共 3 条
[1]   DPVM:支持任务迁移和排队的PVM [J].
鞠九滨 ;
魏晓辉 ;
徐高潮 ;
尹玉 .
计算机学报, 1997, (10) :872-877
[2]  
Efficient checkpointing on MIMD architectures[Ph D diss] .2 Plank S J. Princeton University, Princeton . 1993
[3]  
Memory exclusion: optimizing the performance of checkpointing systems .2 Plank J S et al. . 1996