学位论文 > 优秀研究生学位论文题录展示
基于多核SMP集群环境的光线追踪模拟卫星成像并行研究与实现
作 者: 赵坤
导 师: 李玉岗
学 校: 北京理工大学
专 业: 计算机科学与技术
关键词: 卫星成像仿真 光线追踪 多核SMP集群 并行化 高性能计算
分类号: TP391.41
类 型: 硕士论文
年 份: 2011年
下 载: 45次
引 用: 0次
阅 读: 论文下载
内容摘要
在卫星发射之前通过对卫星成像效果的模拟可以为参数设定以及地面系统搭建提供重要的参考。为了精确模拟卫星的成像效果,本课题分析了用于卫星模拟的各种方法,并选择利用光线追踪原理来进行实现,同时根据搭载三线阵CCD相机的卫星的特有成像原理,通过使用时间积分、空间积分、TDI积分等方法对进行了模拟,得到了精确的模拟图像。在使用光线追踪原理模拟卫星成像时,通过将串行程序进行并行化改写与实现,可以有效地减少计算时间,提升计算的效率。本课题深入研究了目前高性能计算领域应用最为广泛的多核SMP集群架构,分析了其体系结构的特征,比较了现有的可用于SMP集群的并行编程模型,并结合本课题的实际算法采用了将消息传递模型与共享变量模型混合,节点间通过MPI进行通信,而节点内使用OpenMP并行实现的编程方法。在进行卫星成像模拟时,地面场景信息有DEM与DSM两种格式,这两种格式的分辨率与复杂度各不相同,应针对其特点采用不同的并行方法进行实现。本课题根据DEM规则网格点的形式,使用均匀栅格结构对地面场景进行组织,并结合计算过程中数据的局部性特征对串行方法进行了加速。在此基础上,通过面向控制的任务划分方法将计算任务进行分割,使用MPI实现集群中多台节点的并行来完成加速,达到了比较理想的加速效果;同时针对MPI方法在多核SMP集群上的一些缺点,通过将细粒度的OpenMP并行与MPI并行相结合的方法进行了改进,实验结果显示混合编程模型在多节点的情况下有更好的可扩展性。针对DSM复杂三角面片网的结构特征,使用基于SAH规则的KD树结构对场景进行优化组织,并在此基础上探究了其并行化实现的方法。
|
全文目录
摘要 5-6 Abstract 6-10 第1章 绪论 10-17 1.1 本论文研究的目的和意义 10 1.2 遥感卫星模拟成像的研究现状及发展趋势 10-11 1.3 光线追踪的基本原理与研究进展 11-13 1.3.1 经典光线追踪算法的原理 11-12 1.3.2 光线追踪的算法的加速及并行实现 12-13 1.4 多核SMP 集群的体系结构及特性 13-15 1.4.1 SMP 集群 13-14 1.4.2 多核SMP 集群体系结构及其特性 14-15 1.5 本文的研究内容以及组织结构 15-17 第2章 光线追踪算法模拟卫星成像的实现方法 17-28 2.1 卫星成像的原理与模拟实现方式 17-22 2.1.1 卫星成像的原理与模式 17-19 2.1.2 按光线追踪原理对卫星成像的模拟方法 19-21 2.1.3 对卫星特殊成像模式的模拟方法 21 2.1.4 为防止像元颜色失真的模拟方法 21-22 2.1.5 地面场景信息 22 2.2 针对地面场景信息特点选择加速策略 22-25 2.2.1 常用的场景组织数据结构 22-25 2.2.2 各种加速结构的性能比较分析 25 2.3 光线追踪模拟卫星成像流程及并行化分析 25-28 第3章 基于多核 SMP 集群混合编程模型 28-35 3.1 SMP 集群下的编程模型 28-30 3.1.1 多核SMP 集群体系结构对并行模型的特殊要求 28 3.1.2 消息传递编程模型 28-29 3.1.3 共享变量编程模型 29 3.1.4 混合编程模型 29-30 3.2 MPI+OpenMP 混合编程模型 30-35 3.2.1 MPI 消息传递编程模型 30-31 3.2.2 OpenMP 共享变量编程模型 31-32 3.2.3 MPI+OpenMP 混合并行编程模型 32-35 第4章 DEM 场景中细粒度 MPI+OpenMP 并行实现 35-56 4.1 面向控制的任务划分方法 35-41 4.1.1 利用均匀栅格结构实现对DEM 场景的组织 35-36 4.1.2 利用数据的局部性进行加速 36-38 4.1.3 任务划分方法 38-40 4.1.4 此并行方法的额外开销分析 40-41 4.2 进程间的组织结构与并行流程 41-45 4.2.1 使用主从结构组织计算进程 41 4.2.2 采用任务池模式分配任务 41-43 4.2.3 主从结构的性能及瓶颈分析 43-44 4.2.4 主从结构在任务分配及处理过程中的具体流程 44-45 4.2.5 单纯使用MPI 模型的缺点 45 4.3 细粒度OpenMP 并行实现 45-51 4.3.1 进程内部细粒度并行可行性分析 46 4.3.2 OpenMP 并行循环区域分析 46-49 4.3.3 OpenMP 循环调度策略分析与设定 49 4.3.4 改进任务分配策略以扩大并行区域 49-51 4.4 加速效果及性能分析 51-56 4.4.1 实验运行环境 51 4.4.2 并行化后对成像精度的影响 51-52 4.4.3 子任务计算大小对计算时间的影响 52 4.4.4 单节点上MPI 与OpenMP 加速情况对比 52-53 4.4.5 多节点集群中MPI 与OpenMP 并行加速情况对比 53-56 第5章 DSM 场景中粗粒度 MPI+OpenMP 探究 56-65 5.1 使用KD 树组织DSM 场景 56-63 5.1.1 KD 树简介 56-57 5.1.2 KD 树的具体构建方法 57-62 5.1.3 KD 树的遍历方法 62-63 5.2 粗粒度的MPI+OpenMP 并行实现探究 63-65 5.2.1 进程间的任务分配方法 63 5.2.2 粗粒度MPI+OpenMP 并行实现 63-65 总结与展望 65-66 参考文献 66-69 攻读学位期间发表论文与研究成果清单 69-70 致谢 70
|
相似论文
- 基于SMP的内存数据库查询处理优化研究,TP311.13
- 基于GPU的有限元方法研究,O241.82
- 基于多核的动态剖析加速方法研究,TP332
- 过载虚机条件下MPI通信性能改善方法研究,TP302
- 基于GPU/CPU多级并行CFD优化策略的研究,V221
- 高动态条件下捷联惯导动基座传递对准并行算法研究,V249.322
- 基于多图形处理器的高效波动声学模拟器及其应用,TP391.41
- 基于群智能和冲突规避策略的基因—基因交互作用检测及其并行计算,TP391.41
- 多分辨率图像锥结合FCM的多核并行图像分割算法研究,TP391.41
- 新型互连网络结构PGLH上的组播算法研究,TP393.02
- 分布存储结构的通信代码自动生成与优化,TP311.11
- 嵌入式MSDCC异构多核编译器研究,TP314
- 基于粒子模拟问题的GPU高性能计算系统,TP338
- 高性能计算集群文件系统的优化技术研究,TP316
- 基于GPU的程序分析与并行化研究,TP332
- 基于案例-任务驱动教学法的高性能计算课程研究,TP338-4
- 激光能量沉积光路追踪法及其并行化,TN241
- 企业网格计算系统中注册中心的研究与实现,TP393.18
- 基于传输层的P2P流量识别研究,TP393.06
- 天津大学网格系统的研究与设计,TP393.02
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|