学位论文 > 优秀研究生学位论文题录展示

基于OpenCL的多GPU并行计算的研究与应用

作 者: 马俊峰
导 师: 刘胜辉
学 校: 哈尔滨理工大学
专 业: 计算机软件与理论
关键词: 异构计算 开放运算语言 GPU通用计算 并行计算
分类号: TP338.6
类 型: 硕士论文
年 份: 2014年
下 载: 29次
引 用: 0次
阅 读: 论文下载
 

内容摘要


异构计算被视为计算机处理器的发展继单核、多核之后的第三个时代,它实现了多种体系架构的处理器间协同运算,有效缓解在提升CPU时钟频率和内核数量的过程中遇到的散热和能耗问题,同时增强了计算平台的可扩展性。异构计算系统通常包含除CPU以外的一个或多个协处理器,协处理器一般是包含众多处理核心的专用功能计算设备,只有通过合适的并行程序才能充分利用其并行计算能力。OpenCL是一个为异构设备编写程序的标准框架,虽然它的出现增加了程序在各平台之间的可移植性,但是在多个计算设备协同计算时,多种计算设备的调用、设备间的负载均衡等问题严重制约了它的普及。因此,对异构系统下多设备并行计算的研究具有重要的意义。本文依据OpenCL规范,利用多线程技术实现了多平台下多GPU的调用,分析了不同的任务划分模型对计算性能的影响,优化了存储器间的数据传输。随后,设计了可利用多个GPU辅助加速的两个算法来验证多GPU并行计算研究的可行性,第一个算法为适合较大规模数据的内部排序算法,算法中设计了适合设备端的GPU内部排序算法和主机端的基于败者树数据结构的归并排序算法,与CPU串行排序算法相比,该算法在多GPU的辅助下对较大规模数据的排序运算时,性能提升了十倍左右。另一个算法利用多GPU加速柔性作业车间调度问题的求解,该算法设计了适合GPU架构的数据结构以及基于岛屿模型的遗传算法,利用GPU提高了种群内个体的进化以及个体的评估效率。该算法在多GPU的加速下,与基于CPU的遗传算法求解柔性作业车间调度问题相比,在处理更大种群规模的前提下,在更短的时间内取得了较优的解。

全文目录


相似论文

  1. 基于CUDA的图像数字水印技术的研究,TP309.7
  2. 基于MPI的三维地层建模和可视化方法研究,TP391.41
  3. 基于GPU并行加速的正射影像生成研究,TP391.41
  4. 光学衍射场次级衍射的研究,O436.1
  5. 并发系统的并行计算及性能分析,TP338.6
  6. 基于GPU的BLAST程序的并行计算的研究,TP338.6
  7. 基于并行计算的医学超声成像技术研究,TP391.41
  8. 遥感影像并行计算策略研究,TP751
  9. 基于GPU加速FDTD计算速度的研究与仿真,TN011
  10. 一种高性能可扩展公钥密码协处理器的研究与设计,TN918.1
  11. 基于多核计算平台的视频压缩算法研究,TN919.81
  12. 基于多目标智能算法的节能减排发电调度研究,TM73
  13. 非对称多核体系下的阿姆达尔定律性能模型研究,TP338.6
  14. 多时相遥感影像变化检测并行系统设计与实现,TP751
  15. 新型电网广域后备保护的算法研究,TM774
  16. 保护在线自适应整定的研究,TM77
  17. 基于图形处理器的SIFT算法研究,TP391.41
  18. 高动态SINS导航解算算法及其并行化研究,TN966
  19. GPU加速的粒子滤波PET图像重建算法,TP391.41
  20. 基于段落指纹的大规模近似网页检测算法研究,TP393.092
  21. 并行与双系统协同差异进化算法及其应用,TP18

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 各种电子数字计算机 > 并行计算机
© 2012 www.xueweilunwen.com