学位论文 > 优秀研究生学位论文题录展示
基于OpenCL的多GPU并行计算的研究与应用
作 者: 马俊峰
导 师: 刘胜辉
学 校: 哈尔滨理工大学
专 业: 计算机软件与理论
关键词: 异构计算 开放运算语言 GPU通用计算 并行计算
分类号: TP338.6
类 型: 硕士论文
年 份: 2014年
下 载: 29次
引 用: 0次
阅 读: 论文下载
内容摘要
异构计算被视为计算机处理器的发展继单核、多核之后的第三个时代,它实现了多种体系架构的处理器间协同运算,有效缓解在提升CPU时钟频率和内核数量的过程中遇到的散热和能耗问题,同时增强了计算平台的可扩展性。异构计算系统通常包含除CPU以外的一个或多个协处理器,协处理器一般是包含众多处理核心的专用功能计算设备,只有通过合适的并行程序才能充分利用其并行计算能力。OpenCL是一个为异构设备编写程序的标准框架,虽然它的出现增加了程序在各平台之间的可移植性,但是在多个计算设备协同计算时,多种计算设备的调用、设备间的负载均衡等问题严重制约了它的普及。因此,对异构系统下多设备并行计算的研究具有重要的意义。本文依据OpenCL规范,利用多线程技术实现了多平台下多GPU的调用,分析了不同的任务划分模型对计算性能的影响,优化了存储器间的数据传输。随后,设计了可利用多个GPU辅助加速的两个算法来验证多GPU并行计算研究的可行性,第一个算法为适合较大规模数据的内部排序算法,算法中设计了适合设备端的GPU内部排序算法和主机端的基于败者树数据结构的归并排序算法,与CPU串行排序算法相比,该算法在多GPU的辅助下对较大规模数据的排序运算时,性能提升了十倍左右。另一个算法利用多GPU加速柔性作业车间调度问题的求解,该算法设计了适合GPU架构的数据结构以及基于岛屿模型的遗传算法,利用GPU提高了种群内个体的进化以及个体的评估效率。该算法在多GPU的加速下,与基于CPU的遗传算法求解柔性作业车间调度问题相比,在处理更大种群规模的前提下,在更短的时间内取得了较优的解。
|
全文目录
相似论文
- 基于CUDA的图像数字水印技术的研究,TP309.7
- 基于MPI的三维地层建模和可视化方法研究,TP391.41
- 基于GPU并行加速的正射影像生成研究,TP391.41
- 光学衍射场次级衍射的研究,O436.1
- 并发系统的并行计算及性能分析,TP338.6
- 基于GPU的BLAST程序的并行计算的研究,TP338.6
- 基于并行计算的医学超声成像技术研究,TP391.41
- 遥感影像并行计算策略研究,TP751
- 基于GPU加速FDTD计算速度的研究与仿真,TN011
- 一种高性能可扩展公钥密码协处理器的研究与设计,TN918.1
- 基于多核计算平台的视频压缩算法研究,TN919.81
- 基于多目标智能算法的节能减排发电调度研究,TM73
- 非对称多核体系下的阿姆达尔定律性能模型研究,TP338.6
- 多时相遥感影像变化检测并行系统设计与实现,TP751
- 新型电网广域后备保护的算法研究,TM774
- 保护在线自适应整定的研究,TM77
- 基于图形处理器的SIFT算法研究,TP391.41
- 高动态SINS导航解算算法及其并行化研究,TN966
- GPU加速的粒子滤波PET图像重建算法,TP391.41
- 基于段落指纹的大规模近似网页检测算法研究,TP393.092
- 并行与双系统协同差异进化算法及其应用,TP18
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 各种电子数字计算机 > 并行计算机
© 2012 www.xueweilunwen.com
|