学位论文 > 优秀研究生学位论文题录展示

基于CMP集群的并行编程模型的研究与应用

作 者: 董仁举
导 师: 祝永志
学 校: 曲阜师范大学
专 业: 计算机应用技术
关键词: CMP集群 TBBMPI 并行编程模型 性能评测分析 零树小波编码
分类号: TP338.6
类 型: 硕士论文
年 份: 2011年
下 载: 23次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着对处理器主频以及设计复杂度的进一步要求,单核处理器作为计算和控制的核心已经不能满足处理器的快速发展。为了满足复杂应用的需求,处理器的设计引入了新的架构——CMP (Chip on MultiProcessor)。CMP多核技术已经成为当今处理器的主流应用,因此通过将CMP集群化的方式来构建远胜于单一处理器架构的并行系统的研究也得到很大的发展。CMP集群系统的各方面性能虽有所提高,但是适用于这种集群架构的并行编程模型的研究却相对滞后,因而导致多核架构的性能优势未能充分体现。为了找到一种适合于多核集群系统的编程模型,往往要做大量试验,进行对比、分析以及修正。本文针对这一问题,做了如下研究工作:首先简要介绍多核技术的发展及并行编程模型的研究等基本理论知识。介绍了多核处理器硬件相关的主要实现技术,包括同时多线程(Simultaneous MultiThreading, SMT)、对称多处理器(Symmetrical Multi-Processing)和片上多处理器(Chip-on-MultiProcessor, CMP),详细介绍了CMP多核技术在体系结构方面的知识以及CMP相对单核处理器的优势所在。通过实验验证单机下多核处理器的性能提升与SMP系统相比更具有优势。还介绍了几种常见的并行编程模型的使用范围和优缺点,并通过比较选择出最适合多核集群系统的模型。其次以TBBMPI为主要模型详细描述了适用于CMP集群的并行编程模型,它更加贴近于多核集群体系结构,具有更好的性能体现。在这个基础上,重点研究了这个模型的实现机制,并行化粒度,线程数的确定,以及如何优化编程措施等。通过试验进行性能分析比较,得出在一定条件下,TBBMPI编程模型是最适合于CMP集群的选择。最后描述了一个实际的应用问题并行压缩算法——EZW,并详细介绍了并行应用实现的设计过程和实验比较,以及实验环境的安装配置等。通过对结果的分析,能充分展示上述研究工作的有效性,体现了新型编程模型对性能的提高。多核体系架构的出现促成了多核集群的应用。不论是对于大规模的科研应用还是大型的企业级服务器,多核集群系统都已经成为性价比最高的解决方案,针对这方面的研究也是层出不穷,本文最后对基于CMP集群的编程模型进行了展望,并对下一步要进行的工作做了描述,充分发挥编程模型的并行应用。

全文目录


摘要  4-5
Abstract  5-8
第一章 绪论  8-12
  1.1 研究背景  8-10
    1.1.1 多核技术发展现状  8-9
    1.1.2 并行编程模型的发展现状  9-10
  1.2 研究与实现的意义  10
  1.3 论文的主要工作  10-11
  1.4 论文的组织结构  11-12
第二章 CMP架构  12-17
  2.1 多核处理器相关技术  12-14
    2.1.1 SMT结构  12-13
    2.1.2 SMP结构  13
    2.1.3 CMP结构  13-14
  2.2 并行处理器性能分析  14-16
    2.2.1 Amdahl定律  15
    2.2.2 CMP架构性能试验分析  15-16
  2.3 小结  16-17
第三章 并行程序设计模型  17-26
  3.1 消息传递模型  17-19
    3.1.1 MPI(Message Passing Interface)介绍  17
    3.1.2 MPI函数  17-19
  3.2 分布式共享存储模型(Shared Memory Model)  19-20
    3.2.1 OpenMP介绍  19
    3.2.2 OpenMP编程方式  19-20
  3.3 混合并行编程模型(MPI+OpenMP)  20-21
  3.4 TBB  21-25
    3.4.1 TBB介绍  22
    3.4.2 主要功能  22-24
    3.4.3 并行编程运行库的选择  24-25
  3.5 小结  25-26
第四章 基于CMP集群的编程模型的研究  26-36
  4.1 并行编程模型的层次框架  26-27
    4.1.1 内部级并行编程模型  26-27
    4.1.2 节点间并行编程模型  27
  4.2 并行编程模型框架的实现  27-30
    4.2.1 编程模型的实现机制  27-29
    4.2.2 并行化粒度选择  29
    4.2.3 并行化区域中线程数的确定  29-30
  4.3 TBBMPI程序优化  30
  4.4 TBBMPI编程的优势  30-31
  4.5 性能评测  31-35
  4.6 小结  35-36
第五章 TBBMPI编程模型的应用  36-45
  5.1 问题描述  36
  5.2 EZW算法  36-38
    5.2.1 算法描述  36-38
    5.2.2 算法分析  38
  5.3 EZW并行设计实现  38-41
    5.3.1 小波变换  38-39
    5.3.2 创建的数据结构  39-40
    5.3.3 EZW算法并行实现  40-41
  5.4 集群系统环境搭建与配置  41-42
    5.4.1 集群搭建硬件的选择  41-42
    5.4.2 MPI编程环境软件的选择  42
  5.5 试验及结果分析  42-44
  5.6 小结  44-45
第六章 结论与展望  45-46
  6.1 本文工作总结  45
  6.2 进一步研究的展望  45-46
[参考文献]  46-48
在校期间发表的学术论文  48-49
致谢  49

相似论文

  1. 基于MapReduce的并行决策树分类算法研究与实现,TP311.13
  2. 片上网络多核处理器的性能测试与并行编程研究,TN47
  3. 基于MDSP的并行MPEG-4视频编码器的设计与实现,TN919.81
  4. 基于directionlets变换的EZW图像压缩编码算法研究,TP391.41
  5. 多核机群下基于小波原理的并行图像压缩与解压缩,TP391.41
  6. 基于小波分形理论的数字图像压缩技术,TP391.41
  7. 图像数字水印算法的研究,TP309
  8. 遥感图像并行算法的研究及其网格服务的实现,TP751
  9. 一种基于小波变换的改进的嵌入式零树编码算法研究,TN911.22
  10. 基于小波变换的低码率视频压缩技术,TN919.81
  11. 基于嵌入式小波与分形的数字图像混合编码研究,TN919.81
  12. 基于小波理论的图像压缩研究与实现,TP391.41
  13. 小波变换在静态图像压缩中的应用,TN919.8
  14. 基于小波分析的数字水印技术研究,TP309
  15. 基于人脸检测的视频压缩,TP391.41
  16. 基于JPEG2000的静态图像压缩的研究,TN919.81
  17. 基于HVS和CIRC错误校正的自适应图像水印研究,TP309.7
  18. 多核环境下面向数据并行编程模型的性能和可伸缩性研究,TP338.6
  19. 事务存储编程和KD-50-I万亿次机软件库优化的若干问题研究,TP338.6
  20. 分布式系统的故障注入方法研究,TP338.8
  21. 移动计算环境下故障结点检测方法研究,TP338.8

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 各种电子数字计算机 > 并行计算机
© 2012 www.xueweilunwen.com