学位论文 > 优秀研究生学位论文题录展示
多GPU环境下三点相关函数算法研究
作 者: 杨沐津
导 师: 孙济洲
学 校: 天津大学
专 业: 计算机科学与技术
关键词: 多GPU三点相关函数 递归卷积 优化
分类号: TP301.6
类 型: 硕士论文
年 份: 2012年
下 载: 1次
引 用: 0次
阅 读: 论文下载
内容摘要
N点相关函数在星系分布的研究上有重要的意义,是宇宙学模拟中的基本问题。但是朴素解法的计算复杂度却随着点集的扩大而呈点相关数的次方增长,虽然有基于KDTree等的相关优化算法,但是其复杂度也与点集中的点数相关,处理大规模点集时性能也难以满足要求。一种基于递归卷积的优化算法,可以求得近似解,而为了取得较高的计算精度,则要扩大计算矩阵的规模,这同样需要解决相应的性能问题。本文对解决递归卷积算法在解三点相关函数所存在的性能问题、计算精度问题、以及二者之间的折衷问题进行研究和分析。本文首先使用宇宙学模拟中的真实数据分析原始算法在不同的矩阵规模下的计算性能问题和计算精度问题。以此入手,提出相应的解决方案,即通过扩大矩阵规模提升相应的计算精度,而另一方面利用多GPU解决随之带来的性能问题。对于算法并行优化,首先将算法简单迁移到单颗GPU上运行,分析对比不同参数下的性能变化。其次,分析改进后的GPU算法的程序结构,对GPU下的快速傅立叶变换的特性进行分析,调整快速傅立叶的变换维度和变换尺寸,以此获得进一步性能优化。最后分析多GPU程序运行特点,将优化过的单GPU算法进行调整,设计并实现出多GPU环境下的算法,使算法在多GPU环境下相对单GPU的加速比能够接近GPU数,以充分发挥各个GPU的计算效率。本文使用Tesla C2050GPU相关环境进行相关实验,实验结果显示多GPU环境下的递归卷积算法较原始算法在较高计算精度下,性能提升近七百倍。
|
全文目录
摘要 3-4 ABSTRACT 4-7 第一章 绪论 7-12 1.1 研究背景 7-8 1.2 国内外研究现状 8-10 1.3 本文主要研究工作和创新 10-11 1.4 本文内容和结构 11-12 第二章 三点相关函数与多 GPU 计算环境相关背景综述 12-20 2.1 三点相关函数研究背景 12-13 2.1.1 相关函数背景 12 2.1.2 三点相关函数 12-13 2.1.3 三点相关函数的计算问题 13 2.2 基于递归卷积算法的三点相关函数算法 13-17 2.2.1 标量域的递归卷积 13-15 2.2.2 近似三点相关函数求解 15-17 2.3 多 GPU 通用计算背景 17-20 2.3.1 GPU 通用计算 17-18 2.3.2 多 GPU 计算环境 18-20 第三章 多 GPU 环境下三点相关函数算法设计 20-34 3.1 算法分析 20-26 3.1.1 传统递归卷积算法分析 20-25 3.1.2 算法精度分析 25-26 3.1.3 算法分析结论 26 3.2 基于单 GPU 的并行三点相关函数算法设计 26-30 3.2.1 递归卷积步骤分析 26-28 3.2.2 单 GPU 算法主存显存通信问题研究 28 3.2.3 基于递归卷积的单 GPU 算法设计 28-30 3.3 基于 GPU 的算法优化 30-32 3.3.1 补 0 优化策略 30-31 3.3.2 去 0 优化策略 31-32 3.4 多 GPU 三点相关函数算法研究 32-34 3.4.1 单 GPU 算法分析 32 3.4.2 多 GPU 环境下的算法设计 32-34 第四章 实验结果与分析 34-45 4.1 实验环境与实验数据 34 4.2 基于单 GPU 的算法实验结果与性能分析 34-37 4.2.1 实验结果 35 4.2.2 实验分析 35-37 4.3 两种优化策略的实验结果与分析 37-38 4.3.1 补 0 优化策略实验结果与分析 37-38 4.3.2 去 0 优化策略实验结果与分析 38 4.4 基于多 GPU 的算法实验结果与分析 38-41 4.5 计算性能与计算精度的综合分析 41-45 第五章 总结与展望 45-47 5.1 全文总结 45 5.2 进一步的工作 45-47 参考文献 47-50 发表论文和参加科研情况说明 50-51 致谢 51
|
相似论文
- 超声波钎焊填缝及钎缝优化工艺研究,TG454
- 压气机优化平台建立与跨音速压气机气动优化设计,TH45
- 常温低温组合密封结构的有限元分析与优化设计,TH136
- 涡轮S2流面正问题气动优化设计研究,V235.11
- 基于蚁群算法的电梯群优化控制研究,TU857
- 中心回燃式燃烧室燃烧特性研究,TK223.21
- 内置式高效永磁同步电机的设计研究,TM341
- 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
- 多层卫星网络稳定性设计研究,TN927.23
- 海量多数据库集成系统的查询处理研究,TP311.13
- 米曲霉FS-1脂肪酶发酵优化、分离纯化与酶学特性的研究,TQ925.6
- 大红山铁矿井下人员跟踪定位系统的优化研究,TN929.5
- 基于粒子群算法求曲线/曲面间最小距离方法,O182
- 山野菜石参营养成分与品质分析,S647
- 地黄内生菌的分离鉴定和产梓醇菌株的筛选及其发酵研究,TQ461
- Pseudomonas sp.RT-1低温脂肪酶发酵条件优化、纯化及基因的克隆表达,TQ925
- 采油中心的动力特性分析及结构优化改进,TE933.1
- 重组脂肪氧合酶的培养条件优化及其在小麦粉中的应用,TS201.25
- 拖拉机驾驶室的有限元分析及优化设计,S219.02
- 秸秆还田施肥播种机的设计与试验研究,S223.25
- 产甘油益生菌的分离鉴定及其发酵条件的优化,S823.5
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 一般性问题 > 理论、方法 > 算法理论
© 2012 www.xueweilunwen.com
|