学位论文 > 优秀研究生学位论文题录展示
GPU流式计算模型应用研究
作 者: 林江
导 师: 唐敏;童若锋
学 校: 浙江大学
专 业: 计算机应用技术
关键词: 图形处理器 流式计算 序列比对 凸包生成
分类号: TP391.41
类 型: 硕士论文
年 份: 2011年
下 载: 148次
引 用: 0次
阅 读: 论文下载
内容摘要
当前市场主流处理器的发展趋势是多核化/众核化,即通过提高处理器核心数目保持计算性能的持续增长。最新的图形处理器已经能够提高兆级的FLOPS理论峰值,远远超出了市场主流多核CPU。本文以国家自然科学基金项目(60803054)、浙江省自然科学基金项目(Y1100069)和AMD-浙江大学合作项目为研究背景,针对流式计算模型及其应用展开研究,主要工作包括:1、在NVIDIA CUDA平台上实现了基因序列比对的分值计算部分。本文设计实现的Diamond Tiled Wavefront算法的效率能够达到传统的Tiled Wavefront算法的1.7倍,更充分的利用GPU的并行性,更快的返回两个序列串的局部最大匹配值。2、在NVIDIA CUDA平台上实现了基因序列比对的精确比对部分。本文设计实现的流式序列比对算法首次在GPU上实现精确返回各元素的位置匹配结果。3、在ATI Stream平台上实现了三维模型凸包生成算法。在GPU上解决了CPU代码中大量应用vector、queue、map数据结构的问题。同时本文也介绍了一些用于辅助或优化上述算法实现的通用流式算法。4、在NVIDIA GeForce GTX285和ATI Radeon 5870图形处理器上使用CUDA和OpenCL实现了以上算法,并使用一系列模型进行了测试。本文算法对于基于GPU的算法加速研究具有一定的通用意义,并能延伸到其他生物计算、几何处理等领域的相关问题。
|
全文目录
摘要 4-5 Abstract 5-10 图目录 10-11 表目录 11-12 第1章 绪论 12-19 1.1 课题背景 12 1.2 GPU技术 12-16 1.2.1 GPU发展历程 13-14 1.2.2 GPU编程环境 14-16 1.3 流式计算 16-18 1.4 本文目标与结构 18 1.5 本章小结 18-19 第2章 GPU加速的基因序列比对Ⅰ——分值计算 19-36 2.1 引言 19-20 2.2 相关工作 20-24 2.2.1 Smith-Waterman算法 20-21 2.2.2 Wavefront算法 21-22 2.2.3 Tiled Wavefront算法 22-23 2.2.4 相关加速算法 23-24 2.3 Diamond Tiled Wavefront算法 24-27 2.3.1 相关名词 24-25 2.3.2 算法概述 25-26 2.3.3 计算步骤 26-27 2.4 TWF和DTWF算法的比较 27-30 2.4.1 时间开销 28-29 2.4.2 空间开销 29-30 2.5 相关流式算法 30-33 2.5.1 分批处理 30-31 2.5.2 取最大值 31-32 2.5.3 前缀和与数据流缩减算法 32-33 2.6 实验结果与分析 33-35 2.6.1 实验平台 33 2.6.2 实验结果 33-35 2.6.3 结果分析 35 2.7 本章小结 35-36 第3章 GPU加速的基因序列比对Ⅱ——精确比对 36-46 3.1 引言 36 3.2 相关工作 36-37 3.2.1 Hirschberg算法 36-37 3.2.2 Checkpoint算法 37 3.3 流式序列比对算法 37-43 3.3.1 查找起止位置 38-39 3.3.2 流式比对算法 39-43 3.4 实验结果与分析 43-45 3.4.1 实验平台 43 3.4.2 实验结果 43-44 3.4.3 结果分析 44-45 3.5 本章小结 45-46 第4章 GPU加速的三维模型凸包生成 46-61 4.1 引言 46-47 4.2 相关工作 47-48 4.3 三维凸包CPU生成算法 48-49 4.4 流式算法 49-57 4.4.1 三维凸包流式生成算法 49-50 4.4.2 算法流程 50-55 4.4.3 Vector和Queue数据结构的实现 55 4.4.4 Map数据结构的实现 55-56 4.4.5 其他实现优化 56-57 4.5 实验结果与分析 57-60 4.5.1 实验平台 57 4.5.2 实验结果 57-58 4.5.3 性能分析 58-60 4.6 本章小结 60-61 第5章 总结与展望 61-62 5.1 本文工作总结 61 5.2 未来工作展望 61-62 参考文献 62-66 攻读硕士学位期间主要的研究成果 66-67 致谢 67-68 作者简介 68
|
相似论文
- 古细菌生物域内氨基酸替代矩阵的构建,Q936
- 基于多核计算平台的视频压缩算法研究,TN919.81
- 基于CUDA架构的H.264并行计算研究,TN919.81
- Web图像搜索中基于GPU的图像分割技术术究,TP391.41
- 网络协议的自动化Fuzz Testing漏洞挖掘方法,TP393.08
- 流体场景的屏幕空间实时绘制研究,TP391.41
- 基于GPU的H.264到AVS视频转码并行设计,TN919.81
- H.264并行编码算法设计及其在GPU上的实现,TP391.41
- 单张图像去雾研究,TP391.41
- 拓展的隐马氏模型和基于遗传算法的参数估计方法,O211.62
- 基于高性能计算的脑电信号分析,R318.0
- 木马网络通信特征提取技术研究,TP393.08
- 基于FPGA的3D图形处理器IP核的设计与实现,TP391.41
- 基于信息素强度的蚁群算法及其应用研究,TP301.6
- 基于GPU的医学图像三维重建算法及其应用,TP391.41
- 基于GPU的程序分析与并行化研究,TP332
- 生物多序列比对研究算法,Q7-3
- 帕金森病相关基因的聚类分析研究,R742.5
- 基于GPU的高速正则表达式匹配技术研究,TP393.08
- 基于锚点的多基因组序列比对算法,TP301.6
- 基于地理空间信息网格的全球空间数据管理与渲染的关键技术研究,TP391.41
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|