学位论文 > 优秀研究生学位论文题录展示

基于GPU优化的三维实时渲染技术的研究

作 者: 毛华庆
导 师: 边馥苓
学 校: 武汉大学
专 业: 摄影测量与遥感
关键词: CUDA 光线追踪 三维实时渲染 PKD-Tree
分类号: TP391.41
类 型: 博士论文
年 份: 2010年
下 载: 1112次
引 用: 6次
阅 读: 论文下载
 

内容摘要


科学计算可视化、计算机动画及虚拟现实是最近几年来在计算机图形学领域内三大发展方向,其技术核心均为三维真实感图形。当前三维实时渲染技术在军事、航天、航空、医学、地质、勘探、三维游戏和工业计算机辅助设计等方面有着十分广泛的应用。中央处理单元CPU(Central Processing Unit)作为一种通用处理器,要兼顾程序执行和数据运算的并行性、通用性以及它们的平衡性,因此CPU内部大多数的晶体管都用于制造庞大的缓存和复杂的逻辑控制单元,运算单元所占有的比例较小,虽然近年来CPU也出现了多核的产品,不过这样并没有提高晶体管的利用率。与此同时,在游戏产业的推动下,计算机图形处理器(Graphics Processing Unit) GPU的性能正以每年翻倍的速度发展,为了实现更逼真的图形效果,GPU支持越来越复杂的运算,而且在性能上,主流GPU的单精度浮点运算可达到同期CPU的十倍左右,外部存储器带宽为CPU的五倍左右,采用基于GPU计算的构架,所需要的成本和功耗都要优于CPU。而CUDA的问世更克服了许多传统上基于GPU的光线追踪算法所遇到的困难。本文对基于GPU优化的三维实时渲染问题进行了详细的分析,并提出了相应的解决思路和解决方法。主要研究内容包括:GPU三维实时渲染管线的优化处理和并行计算性能优化处理;传统阴影算法及其不足,并对比了光栅化和光线追踪的优缺点。主要工作包括:介绍了GPU的技术框架及其图形渲染管线,包括超长流水线、并行计算、顶点处理器、片元处理器等。并针对GPU与CPU的不同,重点分析和讨论了GPU的加速原理以及当前比较成熟的CUDA通用计算模型构架及其特点。从渲染管线和并行计算两个方面研究了三维实时渲染的优化。在渲染管线方面,分别对渲染管线中常易出现瓶颈的阶段进行了分析,并相应地提出了各个阶段的优化方法。在并行计算方面,以最短时间,在允许误差范围内完成既定的计算任务为优化目标,将重点放在计算的密度和吞吐量上,并总结出在CUDA构架下,并行计算性能优化的三个原则,为实现三维实时渲染系统打下了坚实的理论基础。介绍了阴影的概念及分类,分析了传统基于光栅化的阴影渲染方法和策略,总结了各种阴影算法的不足。采用光线追踪的渲染方式能反映现实世界中光线的多次传播,但其缺点是计算量非常大的,处理计算的时间也较长。为了解决这一不足,本文提出一种基于GPU可并行的PKD-Tree构造算法对三维场景进行划分,以检测光线与场景中物体相交的情况并表现出实时阴影,并给出了与传统KD-Tree计算的比较结果。针对实时三维渲染的重要瓶颈——图形生成速度,本文实现了一个基于GPU的三维实时渲染系统。该系统根据目前图形处理的软硬件体系结构,特别是硬件加速器的图形处理能力,以及图形生成所采用的各种技术对实时渲染进行加速。除此以外,还根据虚拟场景的组织结构和图形生成所需的真实感程度(例如是否产生反射或折射,反射的次数)等因素分析了各种PKD-Tree遍历方法,并详细分析了各种光线二次处理的方法,最后利用递归的方式实现了逼真光效的渲染结果。最后,文章针对未来三维实时渲染技术研究趋势以及研究方向进行了探讨。

全文目录


摘要  6-8
Abstract  8-10
目录  10-12
图目录  12-14
表目录  14-15
1. 绪论  15-20
  1.1 研究背景及意义  15
  1.2 研究现状  15-18
  1.3 研究内容与组织结构  18-20
2. 基于GPU的编程的关键技术  20-37
  2.1 GPU简介  20-27
    2.1.1 GPU的技术框架及加速原理  23-25
    2.1.2 GPU可编程渲染管线  25-27
  2.2 CUDA通用计算模型  27-34
    2.2.1 CUDA架构  28-31
    2.2.2 CUDA通用计算的特点  31-33
    2.2.3 GPU并行通用计算的发展趋势  33-34
  2.3 三维实时渲染技术简介  34-36
    2.3.1 三维实时渲染技术的特点  34-35
    2.3.2 三维实时渲染技术内容  35
    2.3.3 三维实时渲染技术的应用  35-36
  2.4 小结  36-37
3. 三维实时渲染中GPU优化方法  37-54
  3.1 渲染瓶颈  37-39
    3.1.1 CPU的瓶颈  37-39
    3.1.2 GPU的瓶颈  39
  3.2 GPU渲染中的性能优化  39-45
    3.2.1 顶点处理  39-40
    3.2.2 着色器  40
    3.2.3 纹理贴图  40-43
    3.2.4 光栅化  43-44
    3.2.5 反锯齿  44-45
  3.3 并行计算性能优化  45-53
    3.3.1 最大化并行执行原则  45-47
    3.3.2 最大内存带宽原则  47-52
    3.3.3 最大指令吞吐量原则  52-53
  3.4 小结  53-54
4. 基于GPU的实时阴影显示  54-81
  4.1 阴影的概念及分类  54-61
    4.1.1 阴影的概念及其作用  54-59
    4.1.2 阴影的分类  59-61
  4.2 传统阴影算法及其不足  61-69
    4.2.1 平面阴影算法  61-62
    4.2.2 阴影映射算法  62-65
    4.2.3 阴影体算法  65-69
  4.3 基于GPU的阴影显示  69-79
    4.3.1 光栅化与光线追踪  70-72
    4.3.2 光线追踪算法原理  72-74
    4.3.3 PKD-Tree构造及优化  74-78
    4.3.4 效率分析  78-79
  4.4 小结  79-81
5. 基于GPU的三维实时渲染系统  81-107
  5.1 系统框架  81-95
    5.1.1 数据格式与数据结构  83-88
    5.1.2 渲染机制  88-89
    5.1.3 PKD-Tree的遍历  89-92
    5.1.4 结果分析  92-95
  5.2 光线的二次处理  95-106
    5.2.1 光线二次处理的计算  96-98
    5.2.2 阴影效果  98
    5.2.3 反射与折射  98-101
    5.2.4 光线追踪递归算法  101-102
    5.2.5 结果分析  102-106
  5.3 小结  106-107
6. 结论与展望  107-110
  6.1 总结  107-108
  6.2 主要创新点  108
  6.3 工作展望  108-110
参考文献  110-117
攻读博士学位期间学术论文  117-118
攻读博士学位期间参加的科研项目  118-119
致谢  119-121

相似论文

  1. 基于GPU的有限元方法研究,O241.82
  2. 基于CUDA的正则表达式匹配系统的设计与实现,TP311.52
  3. 基于GPGPU的快速白光干涉测量系统研究,O439
  4. 基于多核SMP集群环境的光线追踪模拟卫星成像并行研究与实现,TP391.41
  5. 群体仿真算法研究及疏散仿真系统开发,TP391.9
  6. 基于GPU的图书推荐系统研究与实现,TP391.3
  7. 基于CUDA的视频火灾检测系统,TP391.41
  8. 基于GPU的X射线重建算法加速研究,TP391.41
  9. 基于GPU加速的中性气体泄漏模拟与救援研究,TP391.41
  10. 基于CUDA的实时图像拼接技术研究,TP391.41
  11. 基于CPU+GPU异构平台的字符串匹配算法研究与实现,TP301.6
  12. GPU通用计算与基于SIFT特征的图像匹配并行算法研究,TP391.41
  13. 基于粒子模拟问题的GPU高性能计算系统,TP338
  14. 基于GPU加速的光子映射技术研究,TP391.41
  15. GPS掩星资料处理的GPU并行算法研究,TP391.41
  16. Krylov子空间方法的GPU加速算法研究,TP391.41
  17. 基于CUDA的H.264并行编码器研究与实现,TN919.81
  18. 基于GPU和压缩索引的新一代测序数据再测序研究,Q78
  19. 基于GPU的快速音频检索算法研究与实现,TP391.41
  20. 基于置信度传播的立体匹配算法研究,TP391.41
  21. 自适应局部图像增强技术研究,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com