学位论文 > 优秀研究生学位论文题录展示

基于GPU的二维流场可视化线性积分卷积方法的研究与实现

作 者: 吴占斌
导 师: 秦勃
学 校: 中国海洋大学
专 业: 计算机应用技术
关键词: 二维流场可视化 线性积分卷积 并行计算 GPU 集群
分类号: TP391.41
类 型: 硕士论文
年 份: 2011年
下 载: 36次
引 用: 0次
阅 读: 论文下载
 

内容摘要


二维流场可视化是海洋信息可视化应用研究领域中的重要课题之一,近年来,随着海洋观测技术和科学计算技术的发展,海洋流场数据量越来越庞大,单机计算远远不能满足大规模可视化的计算要求,因此,高性能并行计算已经成为目前实现大规模海洋数据实时可视化的唯一途径。近年来,随着计算机图形处理器(GPU)的快速发展,GPU的应用能力已经远远超出了图形渲染任务,并开始涉足到通用计算领域。特别是nVIDIA公司推出的面向通用计算CUDA开发平台后,GPU能够迅速解决复杂的计算难题,开始大举进军高并行性计算领域。GPU高性能计算已经成为全球高性能计算的发展趋势,成为海洋环境信息计算领域的一个重要发展方向。线积分卷积法方法(简称LIC)是矢量场可视化的重要研究方法,它能够将海洋流场数据转换为可以直接分析的图形、图像信息,并通过人机交互为洞察大规模海洋流场结构信息提供直观、有效的方法。LIC方法能够反映整个矢量场的结构性及流线的方向性,充分显示海洋流场的宏观特性,但是在目前研究中普遍面临一个重大问题,即算法执行时间较长,难以达到实时可视化的效果。本文提出一个基于GPU的二维流场可视化线性积分卷积并行算法,利用GPU的高性能计算技术,以CUDA为开发平台,在CPU中实现算法的串行控制部分,在GPU中实现LIC算法的并行计算部分,成功地实现了LIC算法的实时可视化效果,算法的加速比能够达到50×。为了体现GPU并行计算对大规模海洋数据实时可视化计算的优越性,本文又设计和实现了基于集群的LIC并行算法,通过分析二者的并行化性能和数据处理时间的对比表明,两种不同机制的LIC并行算法在完全保持场的整体特征不变的情况下,基于GPU的并行算法并行度更高,计算时间更少,加速比更大,更能有效地提高数据处理的速度,达到了大规模数据实时处理的要求,为大规模二维离散矢量场场提供了新的并行可视化方法。

全文目录


摘要  5-6
Abstract  6-10
1 绪论  10-16
  1.1 课题研究的背景和意义  10-11
  1.2 科学计算可视化的发展现状  11-13
  1.3 高性能计算发展现状  13-14
  1.4 本文研究的主要内容  14-16
2 GPU集群并行计算技术  16-29
  2.1 并行计算  16-20
    2.1.1 并行计算机体系结构  16-17
    2.1.2 并行编程模式  17-18
    2.1.3 并行算法设计的方法  18-20
  2.2 GPU 技术  20-23
    2.2.1 GPU 概述  20-21
    2.2.2 CUDA 编程模型  21-23
    2.2.3 CUDA 存储模型  23
  2.3 计算机集群概述  23-28
    2.3.1 集群的分类  24
    2.3.2 集群的特点  24-25
    2.3.3 MPI 概述  25-28
  2.4 本章小结  28-29
3 线性积分卷积算法的研究  29-39
  3.1 LIC 的原理  29-30
  3.2 流线与龙格—库塔算法  30-33
    3.2.1 流线  30-31
    3.2.2 龙格—库塔法  31-33
    3.2.3 卷积  33
  3.3 LIC 算法的设计与实现  33-38
    3.3.1 二维流场数据的预处理  34-36
    3.3.2 LIC 算法的具体步骤  36-37
    3.3.3 图像绘制与显示  37-38
  3.4 本章小结  38-39
4. LIC 并行算法设计与实现  39-51
  4.1 算法的并行可行性分析  39-40
    4.1.1 数据并行性  39
    4.1.2 技术可行性  39-40
  4.2 算法在 GPU 中设计与实现  40-45
    4.2.1 CUDA 程序基本框架与执行  40-41
    4.2.2 GPU 中算法的并行架构  41-45
    4.2.3 CUDA 程序的优化  45
  4.3 算法在集群的设计与实现  45-50
    4.3.1 并行算法架构  46-48
    4.3.2 任务分配策略  48-50
  4.4 本章小结  50-51
5. 实验结果对比与分析  51-55
  5.1 并行程序性能分析  51
  5.2 实验结果分析  51-55
    5.2.1 GPU 并行计算的实验结果分析  51-53
    5.2.2 集群并行计算的实验结果分析  53-54
    5.2.3 两种结果对比分析  54-55
6 总结与展望  55-56
参考文献  56-59
附录A: CUDA 开发环境配置方案  59-60
致谢  60-61
个人简历  61
个人发表论文情况  61

相似论文

  1. DMR集群系统高层协议的设计和研究,TN929.52
  2. 基于视觉反馈与行为记忆的GPU并行蚁群算法,TP301.6
  3. 科学发展观视阈下的湖北省白酒产业集群发展研究,F426.82
  4. 高校教务管理网上选课系统优化研究,TP393.09
  5. 基于Linux集群系统的负载均衡算法研究及在Webgis中的应用,TP393.05
  6. Linux集群环境下作业调度算法的研究与实现,TP301.6
  7. 江门不锈钢产业优化与发展模式研究,F224
  8. 莆田市木材加工产业发展研究,F426.88
  9. 吉林省服装产业现状及发展战略研究,F426.86
  10. TD-SCDMA集群系统中负荷控制策略的研究与仿真,TN929.533
  11. 一种高性能可扩展公钥密码协处理器的研究与设计,TN918.1
  12. 基于多核计算平台的视频压缩算法研究,TN919.81
  13. TD-SCDMA集群系统中动态信道分配算法的研究,TN929.533
  14. 基于DMR的4CPFSK基带信号处理技术研究和芯片设计实现,TN929.5
  15. 高速网络环境下的入侵检测系统的研究,TP393.08
  16. 基于GPU的有限元方法研究,O241.82
  17. 射频波注入磁化等离子体的数值模拟,TL612
  18. 基于网络存储的流媒体服务器系统,TN919.8
  19. TD-SCDMA集群系统多用户检测技术的研究,TN929.533
  20. 基于TD-SCDMA的集群通信系统链路负荷控制算法研究,TN929.533
  21. 多机热备高可用集群的设计和研究,TP311.5

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com