学位论文 > 优秀研究生学位论文题录展示

虚拟集群环境下多虚拟机协同检查点容错系统

作 者: 张旻佳
导 师: 金海
学 校: 华中科技大学
专 业: 计算机系统结构
关键词: 容错 虚拟集群 协同检查点 高可靠性
分类号: TP302.8
类 型: 硕士论文
年 份: 2010年
下 载: 108次
引 用: 1次
阅 读: 论文下载
 

内容摘要


随着虚拟集群中虚拟机数目的增加,单个虚拟机的出错往往会使得整个虚拟集群失效的概率也随之增加。因此,提高虚拟集群的可靠性,为其提供容错支持,在错误发生时保证程序运行的连续性和正确性是虚拟集群系统研究、发展、完善过程中必须要解决的一个重要问题。多虚拟机协同检查点容错系统VirtCFT提供了一种对上层应用和整个操作系统具有透明性的,特别是针对拥有消息通信机制的虚拟集群环境的新的容错解决方案。VirtCFT周期性地对各虚拟机进行协调同步,并通过避免网络通信信道中间数据包对虚拟机检查点状态的影响来使得整个虚拟集群中的虚拟机在达到全局一致性状态时做检查点备份。VirtCFT以上述方式来保证虚拟集群出错恢复时的正确性,在错误发生时能够迅速检测到错误的产生并执行恢复操作,使得虚拟集群能够保持正常运行。不同于传统容错技术需要修改应用和操作系统代码,VirtCFT提供了一套对应用和操作系统完全透明的容错平台,其所有的控制命令以及功能模块都在其所保护的虚拟机非特权域之下的虚拟层中实现,因此,现有应用软件或者操作系统不需要做出任何修改或调整的情况下就可以直接在该系统平台上运行并获得容错保护。另外,VirtCFT结合内存和IO虚拟化技术,采用虚拟机检查点增量式备份策略进行CPU、内存、磁盘等状态在内的全系统状态的冗余备份,同时对虚拟机网络在特权域中进行集中式管理,在提供透明性的同时降低了虚拟集群容错系统的运行时间开销。VirtCFT多虚拟机协同检查点容错系统基于Xen虚拟化平台实现。采用Python编写用户层工具,采用C语言编写内核层功能模块。功能测试表明:系统实现了虚拟机出错后对虚拟集群的容错恢复,并保证最终运行结果的正确性。对于计算密集型测试,提供透明性及通用性容错所引入的运行时间开销不超过30%。出错恢复时间为4.51秒~ 5.46秒。

全文目录


摘要  4-5
Abstract  5-8
1 绪论  8-15
  1.1 研究背景  8-10
  1.2 国内外研究现状  10-12
  1.3 课题背景与研究内容  12-14
  1.4 文章框架结构  14-15
2 多虚拟机协同检查点容错系统设计  15-35
  2.1 系统概述  15
  2.2 多虚拟机协同检查点容错系统设计思想  15-17
  2.3 体系结构和功能模块  17-21
  2.4 工作机制与处理流程  21-23
  2.5 错误模型及检错机制  23-24
  2.6 虚拟机协同检查点算法  24-29
  2.7 基于增量的检查点设置方法  29-33
  2.8 小结  33-35
3 多虚拟机协同检查点容错系统的主要实现技术  35-48
  3.1 虚拟机级协同器  35-38
  3.2 虚拟机网络数据包控制管理  38-41
  3.3 虚拟机状态增量式备份  41-45
  3.4 错误检测与恢复  45-46
  3.5 小结  46-48
4 系统测试与性能分析  48-58
  4.1 测试环境  48-50
  4.2 功能测试  50-53
  4.3 性能测试和分析  53-56
  4.4 小结  56-58
5 总结及展望  58-60
致谢  60-62
参考文献  62-66
附录1 攻读学位期间参加的主要科研项目  66
附录2 攻读学位期间申请的国家发明专利目录  66

相似论文

  1. 偏振光/地磁/GPS/SINS组合导航算法研究,V249.328
  2. 并行分布式网络模拟器PDNS容错技术的研究,TP302.8
  3. 移动计算环境下检查点技术研究与Petri网建模,TP301.1
  4. 基于数据流异常检测的嵌入式软件容错研究,TP368.1
  5. 移动代理电子商务环境下的安全迁移模型研究,TP393.08
  6. 无线网络中视频传输容错及转码技术研究,TN919.81
  7. 面向ARM嵌入式系统的H.264解码研究,TP368.1
  8. 电子商务中一种基于邮箱的移动代理通信研究,TP393.09
  9. 高性能存储系统的关键技术研究,TP333
  10. 一种虚拟集群中的轻量级通信机制,TP302
  11. NCUC-Bus现场总线技术研究及实现,TP273.5
  12. 并联式六维地震模拟振动台的设计与研究,TH762.2
  13. 非线性系统的容错保性能控制研究,TP13
  14. 不确定系统的鲁棒故障估计与主动容错控制研究,TP13
  15. 列控系统及其计算机网络的故障诊断与故障容错研究,TP393.06
  16. 网络化控制系统故障诊断与容错控制研究,TP273
  17. 局部扭立方体LTQ_n容错性研究,O157.5
  18. 交叉立方体的容错泛圈性研究,O157.5
  19. 容错计算机系统双机容错软件设计与实现,TP302.8
  20. 基于NoC的软错误点到点容错机制及面向可靠性的应用映射算法研究,TP302.8
  21. 基于冗余传输的片上网络软错误的容错方法研究,TP302.8

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 一般性问题 > 设计与性能分析 > 容错技术
© 2012 www.xueweilunwen.com