学位论文 > 优秀研究生学位论文题录展示

基于协同异构模型的成形模拟计算加速

作 者: 李敏
导 师: 张宜生
学 校: 华中科技大学
专 业: 材料加工工程
关键词: 成形模拟 异构计算 并行计算 位串数组 位掩码 预处理 后处理
分类号: TP338.6
类 型: 博士论文
年 份: 2010年
下 载: 64次
引 用: 0次
阅 读: 论文下载
 

内容摘要


成形模拟中的多场耦合分析,非线性多尺度耦合分析等问题通常需要对大量数据进行多次计算以得到有效的结果,另外这些计算又必须在合理的时间内完成。本文主要从并行计算架构方面研究成形模拟中的计算加速方法,提出了基于CPU/GPU架构的协同异构计算模型来缩短成形模拟过程中的计算时间。本文把工作重点放在了如何优化CPU/GPU协同异构计算模型,缩短计算时间问题的研究上,通过对成形模拟中求解多物理场耦合,多尺度耦合分析过程中的温度场问题,应力应变问题经常用到的有限差分法,矩阵与向量乘积等常用计算方法的GPU架构的程序实现,极大的提高了计算效率,将大量计算转移到计算效率较高的GPU架构上来,减轻CPU的计算压力,缩短计算时间。本文通过对六个数据存储优化方案的实验分析,不断优化CPU/GPU异构计算架构的设计方法,经过各种实验数据证明,得出了比较合适的数据存储方案,针对GPU架构在科学计算方面的一些缺陷,通过CPU来协同完成。通过将完全位串链表与位掩码结合在一起使用优化了存储器结构对计算性能的影响,测试发现,优化方案比没有优化过的方案有25倍的性能提升。在程序设计和收敛求和计算过程中充分利用共享内存空间,减少不必要的数据同步,减少导致缓存命中率下降的因素。通过使用分支同步的方法来处理条件分支,在发生条件分支时,转移方向相同线程的先执行完分支中的指令,然后另外一个转移方向的线程再执行另外一个分支中的指令优化了单指令多线程技术对计算性能的影响。通过实验评估,CPU/GPU协同异构计算模型能解决比单个CPU或者GPU计算系统大16倍左右的问题,却能得到少于20%的错误率,系统负载率只有之前的60%,系统计算效率有50%以上的提升。通过实验结果和并行计算系统现在的发展趋势,相信CPU/GPU协同异构计算将成为并行计算发展历程中越来越重要的一环。本文的研究内容具有重要的工程意义和广阔的应用前景。

全文目录


摘要  4-5
Abstract  5-9
1 绪论  9-19
  1.1 研究背景  9-10
  1.2 科学计算的研究现状  10-19
2 协同异构计算  19-30
  2.1 异构计算技术  19-23
  2.2 协同异构计算系统中CPU和GPU的关系  23-28
  2.3 协同异构计算体系核心架构  28-30
3 算法的GPU程序实现  30-63
  3.1 在GPU架构上实现有限差分法  30-47
  3.2 在GPU架构上实现稀疏矩阵与向量乘积  47-54
  3.3 在GPU架构上实现快速傅里叶变换  54-63
4 协同异构计算模型  63-72
  4.1 异构计算模型的开发  63-67
  4.2 基于CPU架构的预处理过程  67-71
  4.3 基于CPU架构的后处理过程  71-72
5 协同异构计算模型的优化和实施  72-102
  5.1 协同异构计算模型的优化方案  72-89
  5.2 优化方案结果分析  89-92
  5.3 单指令多线程技术对计算性能影响  92-95
  5.4 优化后的协同异构计算模型的实施  95-102
6 全文总结与研究展望  102-104
  6.1 全文总结  102-103
  6.2 研究展望  103-104
致谢  104-105
参考文献  105-116
附录 作者在攻读博士学位期间发表的论文及成果  116

相似论文

  1. 双季戊四醇及其衍生物的合成与工艺研究,TQ223.164
  2. 罗丹明B和罗丹明6G的印迹聚合物制备及性能,O631.3
  3. 超声处理RTM成型酚醛/乙醇在石英纤维表面的竞争吸附,TB332
  4. 基于CCD图像传感器的温度测量技术研究,TH811
  5. 毫米波雷达中频模拟信号源数据产生部分的研究,TN955
  6. 高频雷达复合调制波形设计与处理,TN958.93
  7. 基于FPGA的数字图像处理基本算法研究与实现,TP391.41
  8. 支持XML数据查询的F&B索引结构的研究,TP311.13
  9. 海量多数据库集成系统的查询处理研究,TP311.13
  10. 雾天或背光条件下图像清晰化算法研究及硬件实现,TP391.41
  11. 嵌入式可信计算机系统安全机制的设计与实现,TP309
  12. 词义消歧语料库自动获取方法研究,TP391.1
  13. 舌图像中瘀斑瘀点检测技术研究,TP391.41
  14. FPGA/DSP图像协处理技术及以太网数据传输,TP391.41
  15. 图像实时采集、存储与处理方法研究,TP391.41
  16. 基于嵌入式图像处理单元的运动目标跟踪系统研究,TP391.41
  17. 多线阵CCD视觉测量系统的数据采集与处理,TP274.2
  18. PCI-E数字化仪研制,TP274.2
  19. 机械臂视觉伺服系统的研究,TP242.6
  20. 数字图像处理在集装箱检测中的应用研究,TP274.4
  21. GPS抗干扰技术研究,P228.4

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 各种电子数字计算机 > 并行计算机
© 2012 www.xueweilunwen.com