学位论文 > 优秀研究生学位论文题录展示
并行分布式网络模拟器PDNS容错技术的研究
作 者: 赵世洋
导 师: 李东
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 分布式网络模拟 容错 检查点 套接字恢复
分类号: TP302.8
类 型: 硕士论文
年 份: 2008年
下 载: 40次
引 用: 3次
阅 读: 论文下载
内容摘要
网络模拟,是研究网络行为、评估协议性能的重要方式。PDNS是应用非常广泛的一个并行分布式网络模拟器。然而,PDNS也面临着分布式应用难以回避的系统可靠性方面的缺陷。检查点/卷回恢复技术是实现系统容错的重要手段。通过在系统正常运行过程中设置检查点,保存任务的相关状态。在程序崩溃后,可以根据检查点文件中所记录的系统及进程的信息,将进程卷回至最近保存的正常运行状态继续执行,而不必重启任务,从而节省了大量的重复计算时间。本文主要研究使用检查点/卷回恢复技术来提高PDNS的容错能力。分布式检查算法以单进程检查点算法为基础,对于PDNS而言,则需要首先实现分布式模拟中单个模拟进程的检查点容错。文章分析比较了单进程检查点算法不同实现层次之间的优缺点,然后基于Condor实现了用户级透明检查点。文章通过实验对该单进程检查点的性能进行了测试,并分析了其时空开销的规律。PDNS检查点容错需要解决的第二个问题是如何备份恢复各个模拟节点之间的连接。在局域网中,PDNS通过TCP完成各个节点之间的交互。因此,文章对Linux中TCP连接通信过程进行了分析,在此基础上采用可装载内核模块的方式实现了PDNS各个节点之间TCP连接的备份与恢复。在实现以上两个基本功能之后,选择合适的分布式检查点算法是PDNS检查点容错的最后一个问题。PDNS在模拟时采用了保守的时间同步机制,并且从逻辑上看PDNS具有主从结构。结合PDNS的以上特点,文章给出了Sync-and-Stop分布式同步检查点算法在PDNS中的原型实现。
|
全文目录
摘要 4-5 Abstract 5-9 第1章 绪论 9-14 1.1 课题背景 9-10 1.2 国内外研究现状 10-13 1.2.1 检查点简介 10-11 1.2.2 成型的检查点系统 11-13 1.3 本文的研究内容与组织结构 13-14 第2章 PDNS与检查点恢复技术 14-24 2.1 并行分布式网络模拟器PDNS 14-17 2.1.1 PDNS简介 14-17 2.1.2 PDNS检查点容错需解决的问题 17 2.2 分布式检查点算法 17-20 2.2.1 基本概念 18-19 2.2.2 异步检查点算法 19 2.2.3 同步检查点算法 19-20 2.3 检查点性能 20-23 2.3.1 评价检查点性能的指标 20 2.3.2 改善检查点性能的策略 20-23 2.4 本章小结 23-24 第3章 PDNS中单模拟节点容错的实现 24-31 3.1 用户级非透明检查点 24 3.2 Condor的用户级透明检查点机制 24-27 3.3 基于Condor的NS-2 检查点实现 27-28 3.3.1 使用Condor检查点库 27-28 3.3.2 对NS-2 的修改 28 3.4 实验分析 28-29 3.5 本章小结 29-31 第4章 PDNS中 TCP连接的备份与恢复 31-49 4.1 Linux 内核中套接字实现的分析 31-37 4.1.1 Linux 套接字层 31 4.1.2 Linux TCP 套接字通信过程分析 31-37 4.2 TCP 套接字状态的获取 37-40 4.2.1 TCP 连接套接字的状态 37-38 4.2.2 TCP 监听套接字的状态 38-39 4.2.3 接收与发送数据的状态 39-40 4.3 PDNS 中TCP 连接的备份与恢复 40-48 4.3.1 主要数据结构 40-41 4.3.2 程序流程 41-48 4.4 本章小结 48-49 第5章 PDNS 检查点容错系统 49-56 5.1 PDNS 分布式检查点算法 49-52 5.1.1 Sync-and-Stop 算法 49-51 5.1.2 Chandy-Lamport 算法 51-52 5.1.3 PDNS 检查点算法选择 52 5.2 PDNS 检查点容错系统原型 52-55 5.2.1 相关函数介绍 52 5.2.2 PDNS 中SNS 算法的实现 52-54 5.2.3 PDNS 检查点卷回恢复 54 5.2.4 进一步的讨论 54-55 5.3 本章小结 55-56 结论 56-58 参考文献 58-62 攻读硕士学位期间发表的学术论文 62-64 致谢 64
|
相似论文
- 偏振光/地磁/GPS/SINS组合导航算法研究,V249.328
- 移动计算环境下检查点技术研究与Petri网建模,TP301.1
- 基于数据流异常检测的嵌入式软件容错研究,TP368.1
- 并联式六维地震模拟振动台的设计与研究,TH762.2
- 非线性系统的容错保性能控制研究,TP13
- 高可靠性电动作动器的研究和设计,V249.1
- Web服务组合容错方法研究,TP393.09
- 高可靠星载双机备份系统的设计与评估,TP309.3
- 并行计算环境中基于检查点的卷回恢复技术研究,TP338.6
- 片上路由器及其可靠性的研究与容错设计,TN47
- 无线传感器网络若干中继器放置问题研究,TN929.5
- NGI中智能容错QoS路由机制的研究与仿真实现,TP393.02
- 全IP架构复合移动通信系统的容错机制设计,TN929.5
- 跳频通信系统中同步技术的研究,TN914.41
- 星载高速数据处理技术研究,V446.9
- 基于虚拟化技术的云计算容错方案研究,TP302.8
- 飞控计算机的容错研究与设计,TP302.8
- 基于多模型切换的主动容错控制,V249
- 基于分散结构的电磁弹射系统自律控制研究,V271.492
- 时滞系统的鲁棒容错控制,TP13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 一般性问题 > 设计与性能分析 > 容错技术
© 2012 www.xueweilunwen.com
|