学位论文 > 优秀研究生学位论文题录展示

基于GPU的有限元方法研究

作 者: 胡耀国
导 师: 杨文兵
学 校: 华中科技大学
专 业: 工程力学
关键词: GPU CUDA 并行计算 高性能计算 有限元
分类号: O241.82
类 型: 硕士论文
年 份: 2011年
下 载: 76次
引 用: 0次
阅 读: 论文下载
 

内容摘要


近年来,随着图形处理器(GPU)硬件构架的不断发展,GPU的可编程性能不断加强,同时计算能力大幅度增加,使得GPU开始逐渐出现在数值计算领域。随着NVIDIA CUDA并行计算平台的不断完善,GPU并行计算也不断渗透到各个学科。由于有限元方法实现的特殊性,在GPU构架成熟前的移植工作发展非常缓慢,到目前为止也只是处于初步状态。本文通过分析NVIDIA GPU构架以及其上CUDA平台的编程模型特点,将传统的有限元分析程序中计算量比较大的组装以及稀疏线性方程组求解两部分移植到GPU上。在充分考虑CUDA平台GPU的硬件特点后,选定迭代法中的共轭梯度法(CG)求解稀疏线性方程组,该方法中计算量最大的部分为稀疏矩阵与向量相乘(SpMV)。考虑到CUDA平台数据读写的特点,先确定总刚矩阵的压缩存储格式为CSR,然后对模型的节点进行重排序,以使得在方程求解中的SpMV操作可以更好的利用GPU中宝贵的缓存。为了保证组装过程中高度的并行化计算,防止数据读写冲突,对模型的单元进行分组,使得每一组中的单元互不相邻,这样进行组装计算时每个线程计算的单刚在总刚中对应的位置不会有任何重叠,防止了潜在的数据冲突。将CG法中向量相关的操作使用CUDA BLAS库替代,同时实现自己的SpMV操作,这样方程求解也充分利用了GPU资源。通过计算4种不同的单元模型,相比CPU端的计算结果,GPU在组装部分最高可以达到7倍加速,在方程求解部分最高达到了6.4倍加速。结果表明使用了GPU资源的有限元方法可以得到较好的加速效果

全文目录


摘要  4-5
ABSTRACT  5-8
1. 绪论  8-11
  1.1. 选题背景和意义  8
  1.2. 国内外研究进展  8-10
  1.3. 研究内容  10-11
2 .NVIDIA CUDA 平台  11-19
  2.1. GPU 并行计算  11-12
  2.2. 平台简介  12-14
  2.3. CUDA 编程模型  14-17
  2.4. CUDA 程序的优化  17-19
3. 预处理  19-35
  3.1. 稀疏矩阵压缩格式  19-20
  3.2. 节点排序  20-30
  3.3. 单元分组  30-32
  3.4. 组装预处理  32-35
4. 组装  35-45
  4.1. 杆单元(TRUSS)  35-36
  4.2. 平面三角单元(CST)  36-40
  4.3. 平面四边形单元(Q4)  40
  4.4. 空间六面体单元(H8)  40-45
5. 方程求解  45-58
  5.1. 共轭梯度法及其性质  45-47
  5.2. 基于GPU 的稀疏矩阵与向量乘法  47-56
  5.3. 基于GPU 实现的方程组求解器算法流程  56-58
6. 计算结果及分析  58-65
  6.1. 杆单元  58-60
  6.2. 平面三角单元  60-61
  6.3. 平面四边形单元  61-62
  6.4. 空间六面体单元  62-64
  6.5. 结果分析  64-65
7. 总结与展望  65-68
致谢  68-69
参考文献  69-76
附录 攻读硕士期间发表的论文  76

相似论文

  1. 混粉电火花成型机主机系统及工艺试验的研究,TG661
  2. 电火花加工中的电极损耗机理及控制研究,TG661
  3. 永磁磁力耦合器结构与特性研究,TH139
  4. 谐波齿轮传动柔轮应力及轮齿磨损分析,TH132.43
  5. 常温低温组合密封结构的有限元分析与优化设计,TH136
  6. 碾压混凝土拱坝温度应力仿真分析与分缝设计研究,TV642.2
  7. 竖向荷载作用下半刚性连接钢框架的简化分析,TU391
  8. 带填充墙框架结构非线性有限元分析,TU323.5
  9. 电流及电场对结晶器铜板上电镀镍及其合金镀层性能的影响,TQ153.2
  10. 基于时程分析法碾压混凝土重力坝抗震稳定性分析,TV642.2
  11. 个性化人工膝关节设计及其生物力学特性研究,R318.1
  12. 船用锅炉过热器管束胀口应力应变分析,TQ051.5
  13. 电子产品质量监控测试设备设计,TN06
  14. 深水海底管道S型铺管法安装分析,TE973
  15. 拖拉机驾驶室的有限元分析及优化设计,S219.02
  16. 拖拉机电控液压动力转向系统的转向机构及液压系统设计,S219.02
  17. 智能森林灭火航弹研究,S762
  18. 多针内固定治疗跟骨骨折的有限元分析,R687.3
  19. 三种后路腰椎融合术致相邻节段退变的有限元分析比较,R687.3
  20. 踝关节及周围韧带三维有限元模型的建立与分析,R687.3
  21. 基于视觉反馈与行为记忆的GPU并行蚁群算法,TP301.6

中图分类: > 数理科学和化学 > 数学 > 计算数学 > 数值分析 > 微分方程、积分方程的数值解法 > 偏微分方程的数值解法
© 2012 www.xueweilunwen.com