学位论文 > 优秀研究生学位论文题录展示

基于多核的程序并行优化的研究与实现

作 者: 郭慎
导 师: 李培峰;朱巧明
学 校: 苏州大学
专 业: 计算机应用技术
关键词: 多核 并行 依赖关系 并行粒度 并行加速比
分类号: TP332
类 型: 硕士论文
年 份: 2010年
下 载: 240次
引 用: 3次
阅 读: 论文下载
 

内容摘要


随着多核处理器在短短两年时间内的普及,如何充分利用它的并行处理能力开发并行化程序成为了现今多核应用研究的重点和难点之一。本文在深入分析了多核计算技术的基础上,提出了程序过程内与过程间可并行信息挖掘的方法,为实现程序的并行化提供依据。使用国际通用的并行评测标准(如Livermore、LAPACK和NAS等)进行实验,并把实验结果与目前流行的程序并行化工具Intel Parallel Studio进行比较,来验证我们的方法。本文提出的过程内可并行信息挖掘方法主要针对与可并行信息关系密切的依赖关系展开。以程序执行时间,程序中的循环部分、数据依赖性分析以及程序执行时间与循环次数比等特征来表征程序的可并行性,并采用支持向量机(SVM)根据以上特征进行程序中的可并行点的挖掘。实验证明,该方法更能符合实际应用的需要,发现的可并行点做并行化后有可观的并行加速比。本文提出的过程间可并行信息挖掘方法主要通过构建过程间依赖图的方式,有效的整合了过程间依赖信息。并提出了过程内依赖信息对过程间依赖信息有影响,需要通过加入过程内依赖信息从而提取优化过程间依赖信息的思想。对比实验证明,该方法具有更好的过程间可并行信息的挖掘效果。最后,本文给出了在并行测试集中使用上述两种可并行信息挖掘方法加以结合的实验结果,实验表明粗粒度与细粒度可并行信息挖掘方法能够获得有效的程序可并行信息,在多核平台得到良好的程序并行加速比。

全文目录


中文摘要  4-5
Abstract  5-9
第1章 序言  9-15
  1.1 研究背景  9-11
  1.2 研究现状  11-12
  1.3 本文的研究内容  12-13
  1.4 本文的研究意义  13
  1.5 本文结构  13-15
第2章 并行优化相关技术  15-25
  2.1 并行优化相关技术概述  15-17
  2.2 依赖关系分析  17-21
    2.2.1 过程内依赖关系分析技术  17-20
    2.2.2 过程间依赖关系分析技术  20-21
  2.3 指针分析  21-22
  2.4 评测方法  22-24
    2.4.1 OpenMP 简介  22-23
    2.4.2 并行代码的性能评价  23-24
  2.5 本章小结  24-25
第3章 过程内细粒度可并行性挖掘  25-41
  3.1 数据依赖性概念  25-28
  3.2 数据依赖分析算法  28-31
    3.2.1 GCD-Test 算法  28-30
    3.2.2 扩展的GCD(EGCD)数据依赖分析算法  30-31
  3.3 基于特征的程序并行点的发现  31-36
    3.3.1 SVM 分类工具  31-33
    3.3.2 循环内可并行点发现  33-35
    3.3.3 可并行特征文件的构建  35-36
  3.4 细粒度可并行点发现实验与分析  36-39
    3.4.1 Intel Parallel Studio 并行工具  36
    3.4.2 Livermore 循环测试集  36-37
    3.4.3 LAPACK 并行测试集  37
    3.4.4 实验与分析  37-39
  3.5 本章小结  39-41
第4章 过程间粗粒度可并行性挖掘  41-49
  4.1 过程间并行优化技术  41-42
  4.2 过程间依赖图的构建  42-45
  4.3 基于过程间依赖图的可并行点发现方法  45-46
  4.4 粗粒度可并行点发现实验与分析  46-48
  4.5 本章小结  48-49
第5章 程序优化技术在多核平台中的应用  49-55
  5.1 多核处理器(CMP)  49-50
  5.2 NAS 并行标准  50
  5.3 过程内与过程间可并行信息挖掘方法的结合  50-52
  5.4 实验与分析  52-53
  5.5 本章小结  53-55
第6章 总结和展望  55-57
  6.1 全文工作总结  55-56
  6.2 进一步工作  56-57
参考文献  57-61
攻读学位期间公开发表的论文  61-62
致谢  62-63

相似论文

  1. 频繁图结构并行挖掘算法的研究与实现,TP311.13
  2. 大规模计算环境下网络模拟任务划分研究,TP393.01
  3. 基于并行算法的模糊综合评价模型的设计与应用,TP18
  4. 基于视觉反馈与行为记忆的GPU并行蚁群算法,TP301.6
  5. 基于FPGA高清视频车辆检测系统的设计与实现,TP391.41
  6. 基于多核学习的高性能核分类方法研究,TP391.41
  7. 近似字符串匹配研究及其在URL检测中的应用,TP393.08
  8. H.264并行视频转码算法研究,TN919.81
  9. TD-SCDMA无线链路控制协议实现研究,TN929.533
  10. USB接口的固态盘原型系统的设计与实现,TP333
  11. 基于SMP的内存数据库查询处理优化研究,TP311.13
  12. 面向并行环境的遥感影像分类算法设计与实现,TP751
  13. 基于宏单元异步乘法器的研究与设计,TP332.22
  14. 多DSP并行航迹规划系统接口驱动程序设计与实现,TP368.12
  15. 多核系统中实时任务调度算法的研究,TP332
  16. 发动机类复杂曲面零件数字化设计关键技术研究,TK402
  17. 保护在线自适应整定的研究,TM77
  18. 基于多核的动态剖析加速方法研究,TP332
  19. 基于PDNS的BitTorrent流量局域化算法的仿真与实现,TP393.093
  20. 一种对等网络文件共享算法仿真与性能分析比较,TP393.09
  21. GPU加速的仿射算术在几何设计中的应用研究,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 运算器和控制器(CPU)
© 2012 www.xueweilunwen.com