学位论文 > 优秀研究生学位论文题录展示

容灾存储系统故障检测技术研究

作 者: 杨光
导 师: 周敬利
学 校: 华中科技大学
专 业: 计算机系统结构
关键词: 容灾存储系统 故障检测 权故障检测算法 QoS(服务质量)
分类号: TP274.4
类 型: 博士论文
年 份: 2008年
下 载: 336次
引 用: 1次
阅 读: 论文下载
 

内容摘要


随着存储系统与网络技术的不断发展,存储系统在存储容量、性能、可扩展性等方面己取得了飞速的发展,但不可预计的故障、甚至是不可抗拒的故障现象也越来越多,因此提高存储系统的可靠性,保证业务的正常运行己经势在必行。而容灾存储系统也存在一些局限性,比如容灾主要是针对数据备份而言,确保应用不因为意外事件而带来重大损失,但不能保证应用不因为故障的发生而被中断;不能快速反映系统视图的变化。针对容灾存储系统的局限性,在研究故障检测技术的基础上,结合层次式设计,提出基于容灾存储系统的故障检测系统。故障检测系统是实现系统容灾的基础,他能保证当节点故障时应用会继续运行,并能使各节点间通组间通讯过快速生成统一视图。快速、高效、准确的故障检测是能否实现有效容灾的前提和保障。当前,故障检测仍存在一些需求尚未解决,如信息丢失、可扩展性、灵活性和动态性等。因此,有必要寻找一种能有效解决上述需求的故障检测方法。为了建立故障检测系统,在故障检测模型、故障检测系统的性能评价指标、故障检测系统构架和故障检测器等方面作了以下几方面的研究:1.随着容灾存储系统规模的不断扩大,故障检测服务也在向大规模的方向发展。针对大规模故障检测所遇到的问题,分析了大规模故障检测服务应该满足的特性和新的要求;研究了现有的实现大规模故障检测服务的方法;针对故障检测器需要解决的基本问题,对现有的实现方式进行了研究,并比较不同方法之间的差异及各种故障检测协议的优缺点。2.设计了一种基于容灾存储系统故障检测机制,有效缓解了负载对故障检测的影响,实现了快速、灵活的故障检测。当节点的加入、退出和崩溃时各控制节点可以通过组间通知方式生成一个统一的全局视图。3.设计了一种自适应故障检测算法——dAFD。dAFD通过估计预期到达时间来提供一个检测时间,动态地估算心跳消息超时时限,以适应系统状态的变化,减少故障检测服务的错误,并按照给出的QoS参数分析其性能。4.设计了一种权故障检测算法WFDA。WFDA输出一个权值,假如被检测的节点崩溃了,这个权值会随着时间的流逝而单调增长。如果这个被检测节点又恢复可用了,这个权值又要被初始化,应用程序会询问故障检测模块以获得相应节点的权值。每个应用程序都有自己的阈值,这些阈值反映了每个应用程序的需求。当应用程序的阈值大于权值时,故障检测器会认为被检测节点失效,反之则认为节点可用。这种故障检测算法的优点是能按照网络状态和应用程序的需要自动调整。5.对权故障检测算法进行了改进,将其称为QWFD故障检测算法,它能解决权故障检测算法需要消息行为符合正态分布的假设,以及权故障检测算法不能对服务质量做出定量的需求,应用范围也更加广泛。在权故障检测算法的实现中,应用程序设定的可信度阈值只能定性地刻画其QoS要求,但在实际应用中,大多数分布式应用程序都存在一些较为严格的时间上的约束,故更加需要故障检测器可以按照QoS评价指标支持准确的定量的QoS需求。权故障检测算法的实现,往往需要假设消息行为符合正态分布。但在复杂的大规模存储系统中,存在复杂的异步性、较长的传输延时、较高的消息丢失率,而且其基础结构是动态可配置的,大量的组件及其分布也是动态的,在这样的环境下,消息行为不可能一直符合某种特定的分布特性。因此,作为一个通用组件来设计的故障检测器不应对此作出任何假设。

全文目录


摘要  4-6
Abstract  6-10
1 绪论  10-22
  1.1 容灾系统  10-13
  1.2 故障检测  13-20
  1.3 本文的研究内容及组织结构  20-22
2 故障检测技术的研究与发展  22-51
  2.1 分布式系统模型  22-26
  2.2 故障检测系统的级别和分类  26-29
  2.3 基于容灾存储系统故障检测的特点  29-30
  2.4 性能的评价指标  30-36
  2.5 故障检测技术的研究现状及存在的问题  36-40
  2.6 检测协议的分类  40-50
  2.7 本章小结  50-51
3 dAFD故障检测算法的设计  51-64
  3.1 dAFD故障检测器  51-52
  3.2 dAFD的设计  52-54
  3.3 dAFD算法的实现  54-56
  3.4 检测算法的证明  56-59
  3.5 实验结果及其分析  59-63
  3.6 本章小结  63-64
4 权故障检测算法的设计  64-88
  4.1 WFDA障检测器  64-65
  4.2 WFDA的设计  65-67
  4.3 WFDA的实现  67-69
  4.4 WFDA性能测试实验及其结果分析  69-74
  4.5 QWFD故障检测算法  74-76
  4.6 QWFD算法的设计  76-81
  4.7 算法证明  81-82
  4.8 QWFD性能测试实验及结果分析  82-86
  4.9 本章小结  86-88
5 容灾存储系统的故障检测技术研究  88-116
  5.1 容灾存储系统故障检测模型的建立  88-90
  5.2 检测机制的构架  90-97
  5.3 检测服务的过程  97-103
  5.4 故障检测算法  103-104
  5.5 故障检测器的设计  104-111
  5.6 系统实验及分析  111-114
  5.7 本章小结  114-116
6 总结与展望  116-118
  6.1 全文总结  116
  6.2 研究展望  116-118
致谢  118-119
参考文献  119-130
附录 攻读博士学位期间的学术论文  130

相似论文

  1. 移动计算环境下故障结点检测方法研究,TP338.8
  2. 太阳能热水器采暖控制系统的设计,TP273
  3. 太阳能集热洗浴控制系统的设计及其故障检测,TP273
  4. 网络化控制系统故障检测方法仿真研究,TP273
  5. 基于逻辑卷的双控制器磁盘阵列系统的控制与管理,TP333.35
  6. 基于广域网的容灾存储系统故障检测技术的研究与设计,TP333
  7. 不确定系统的鲁棒故障估计与主动容错控制研究,TP13
  8. 一类时滞切换系统的鲁棒故障检测,TP13
  9. 20kV线路接地保护研究,TM862
  10. 直升机传动链故障诊断与健康管理系统设计及关键技术研究,V267
  11. 汽车脚踏板操纵机构总成试验台设计及其关键技术研究,U467.5
  12. 基于DSP的变频机故障检测系统研究与设计,TM921.51
  13. 风电场电网电压故障检测方法研究,TM614
  14. 光伏阵列故障检测方法的研究,TM615
  15. 基于MUSIC算法的电动机断条故障检测,TM343
  16. 红外热像技术在散热器故障检测中的应用,TU832.23
  17. 基于冲击脉冲传感器的轴承检测仪调理电路研究,TH865
  18. 基于故障树的网络环境主机故障检测系统的设计与实现,TP393.08
  19. 基于不变式的软件故障检测与恢复技术研究,TP311.52
  20. 运营商城域网的服务质量评估与优化策略项目的研究,F224
  21. 基于改进KICA的故障检测方法在连续采煤机上的应用研究,TD421.64

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化技术及设备 > 自动化系统 > 数据处理、数据处理系统 > 集中检测与巡回检测系统
© 2012 www.xueweilunwen.com