学位论文 > 优秀研究生学位论文题录展示
容错计算机系统双机容错软件设计与实现
作 者: 倪文玺
导 师: 贠卫国
学 校: 西安建筑科技大学
专 业: 计算机系统结构
关键词: 容错 双机热备 心跳检测 双机切换
分类号: TP302.8
类 型: 硕士论文
年 份: 2011年
下 载: 20次
引 用: 0次
阅 读: 论文下载
内容摘要
随着通讯与计算机技术的迅速发展,越来越多的计算机系统用来提供各种及时可靠的服务,如何保证计算机系统运行可靠、稳定和持久是需要解决的关键问题,这就需要系统具备冗余和容错能力。本文在对影响系统可用性因素分析的基础上,考虑到系统成本和企业适用情况以及方案灵活性等因素,设计了一套基于无磁盘阵列的主从结构硬件平台运行的双机容错软件。论文首先概述了容错计算机系统及国内外发展现状,对主要工作做了简要介绍。其次,对双机热备工作模型和主要技术进行综述,比较双机热备的两种实现方式:共享存储和数据同步,根据双机系统Markov模型分析其高可用性。第三,论文给出了双机容错软件的主要技术,其中单一系统映像和故障诊断及恢复技术是实现的重点。第四,根据双机热备的工作模型和技术分析,在设计中将双机容错软件分为心跳检测模块和资源管理模块两部分。心跳检测模块包括节点故障检测、系统服务故障检测、资源故障检测等,同时保持双机连接;资源管理模块实现主/从机切换,资源状态查询、接管等任务。该系统以双节点的集群系统为目标,并且具有良好的扩展性和可移植性。最后进行实现和说明,测试了双机容错软件基本功能,并进行了双机视频切换的应用实验,测试结果表明能够保持系统稳定运行,实现企业核心业务基本功能,达到设计目标。
|
全文目录
摘要 3-4 Abstract 4-8 1 绪论 8-13 1.1 课题研究背景 8-9 1.2 课题国内外研究现状 9-11 1.2.1 系统可用性分析 9-10 1.2.2 当前主要技术 10-11 1.3 课题主要研究工作 11-13 2 容错计算机系统 13-23 2.1 计算机容错技术 13-15 2.1.1 硬件冗余 13-14 2.1.2 软件冗余 14-15 2.1.3 时间冗余 15 2.2 双机容错软件 15-21 2.2.1 双机容错软件工作模式 16-17 2.2.2 双机热备的两种实现方式 17-19 2.2.3 双机热备的数据访问 19-20 2.2.4 双机热备主要技术 20-21 2.2.5 双机热备的高可用性分析 21 2.3 本章小结 21-23 3 容错计算机系统双机容错软件主要技术 23-28 3.1 单一系统映像(SSI) 23-24 3.2 故障诊断及恢复 24-25 3.3 故障接管 25-26 3.4 文件镜像技术 26-28 4 HA_PY 双机容错软件设计及实现 28-46 4.1 Python 28-29 4.2 HA _PY 系统总体设计 29-31 4.3 HA _PY 网络拓扑结构 31-32 4.4 HA _PY 心跳检测及故障规避 32-38 4.5 ARP 报文发送与接收 38-40 4.6 HA _PY 资源管理 40-44 4.7 MySQL 数据同步 44-45 4.8 本章小结 45-46 5 软件测试及可靠性分析 46-57 5.1 测试原理及说明 46-47 5.2 测试环境基本配置 47-48 5.3 测试项目及过程 48-55 5.3.1 HA_PY 程序及工具文件说明 48-49 5.3.2 软件执行过程 49-53 5.3.3 故障注入检测项目及结果说明 53 5.3.4 双机视频切换实验 53-55 5.4 本章小结 55-57 6 全文总结 57-59 致谢 59-60 参考文献 60-63 附录:攻读硕士学位期间发表论文 63
|
相似论文
- 偏振光/地磁/GPS/SINS组合导航算法研究,V249.328
- 并行分布式网络模拟器PDNS容错技术的研究,TP302.8
- 移动计算环境下检查点技术研究与Petri网建模,TP301.1
- 基于数据流异常检测的嵌入式软件容错研究,TP368.1
- 移动代理电子商务环境下的安全迁移模型研究,TP393.08
- 无线网络中视频传输容错及转码技术研究,TN919.81
- 基于逻辑卷的双控制器磁盘阵列系统的控制与管理,TP333.35
- 基于VxWorks的嵌入式控制器的双机热备系统应用,TP273
- 面向ARM嵌入式系统的H.264解码研究,TP368.1
- 电子商务中一种基于邮箱的移动代理通信研究,TP393.09
- 高性能存储系统的关键技术研究,TP333
- Hadoop分布式文件系统(HDFS)可靠性的研究与优化,TP316.4
- 实时系统中基于容错的节能调度算法研究,TP316.2
- 并联式六维地震模拟振动台的设计与研究,TH762.2
- 非线性系统的容错保性能控制研究,TP13
- 不确定系统的鲁棒故障估计与主动容错控制研究,TP13
- 工业分布式实时数据库网络通信平台的研究与设计,TP311.13
- 列控系统及其计算机网络的故障诊断与故障容错研究,TP393.06
- 网络化控制系统故障诊断与容错控制研究,TP273
- 局部扭立方体LTQ_n容错性研究,O157.5
- 交叉立方体的容错泛圈性研究,O157.5
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 一般性问题 > 设计与性能分析 > 容错技术
© 2012 www.xueweilunwen.com
|