基于自适应心跳算法的分布式系统故障检测器

被引:32
作者
王明
张春熹
伊小素
机构
[1] 北京航空航天大学惯性技术国防科技重点实验室
关键词
分布式系统; 故障检测; 自适应心跳检测算法;
D O I
暂无
中图分类号
TP316.4 [分布式操作系统、并行式操作系统];
学科分类号
081205 [计算机软件];
摘要
故障检测是容错分布式系统中的关键技术之一.为了提高故障检测的性能,提出一种新型的故障检测器——自适应心跳检测器(SA-HD,Self-Adaptive Heartbeat Detec-tor).SA-HD采用了基于拉式(pull)的自适应心跳算法,在考虑故障检测性能的同时也考虑了心跳检测所占用的网络资源对网络性能的影响.SA-HD能够根据网络负载调节自身发送心跳消息的频率,提高了心跳检测的网络环境适应能力,尤其是在高负载的环境下,能够有效改善心跳检测的性能.建立了SA-HD的模型,对其性能进行了仿真分析,并通过试验验证了SA-HD性能要优于传统推式(push)的心跳检测器.
引用
收藏
页码:952 / 956
页数:5
相关论文
共 2 条
[1]
Unreliable failure detectors for reliable distributed systems[J] Tushar Deepak Chandra;Sam Toueg Journal of the ACM (JACM) 1996,
[2]
Adaptive Failure Detection via Heartbeat under Hadoop Hao Zhu;Haopeng Chen; IEEE Asia-Pacific Services Computing Conference 2011,