学位论文 > 优秀研究生学位论文题录展示

基于任务并行策略的多核程序优化研究

作 者: 张建强
导 师: 郑晓薇
学 校: 辽宁师范大学
专 业: 课程与教学论
关键词: 多核并行技术 任务并行策略 多核集群 线程构建模块 OpenMP
分类号: TP332
类 型: 硕士论文
年 份: 2011年
下 载: 82次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着多核处理器的普及,如何有效利用多核处理器资源,成为了并行计算领域的研究热点。现在很多应用程序都是在单核单线程环境下开发的,在多核环境下还是以单线程形式执行,导致了多核资源的浪费。为了能够充分发挥多核潜力,提升应用程序的性能。本文在深入分析多核并行技术的前提下,研究了基于任务并行策略的多核程序优化技术。任务并行的优势在于它是轻量级的组件,调度任务的开销要比调度进程和线程的开销小。通过研究Intel线程构建模块(TBB),本文提出了基于任务调度器的的并行优化方法。该方法是通过任务调度器创建线程池管理任务,采用任务密取技术负载均衡地把任务自动地映射到多个逻辑线程上并行执行,从而提高多核资源的使用效率和应用程序的性能。针对多核集群环境提出了一种层次任务并行化方法,上层MPI提供节点间进程级的任务并行,下层TBB提供多核节点内部的任务并行。结合两者的优势,实现进程和处理节点以及线程和多处理核的两级并行。为了验证以上两种方法的高效性,以N皇后经典算法为例,分别在共享存储模型TBB和混合并行编程模型MPI+TBB环境下进行了循环迭代的并行化测验。实验结果表明,共享存储模型并行化的加速比和CPU利用率都能达到一个可观的数值,体现了任务调度器并行化的优越性;采用任务划分的混合并行编程模型不但可以减少程序执行时间,获得更好的加速比和执行效率,而且明显地提高了多核集群并行性能。最后本文以模糊C均值算法为例,运用OpenMP工作分区编码,实现了多核平台下的串行程序热点区域的任务并行化。运用Intel parallel studio高性能工具对并行化结果进行验证,从执行时间和并发性方面进行了比较,其性能都有了很大的提高。体现了任务并行策略通用性和可靠性的特点,对多核应用程序的性能优化有很好的实用性。

全文目录


摘要  3-4
Abstract  4-8
1 绪论  8-11
  1.1 研究背景及意义  8
  1.2 国内外多核技术的研究现状  8-9
  1.3 论文的主要内容  9-10
  1.4 论文的组织结构  10-11
2 多核并行化相关理论  11-22
  2.1 多核并行基础知识  11-15
    2.1.1 多核处理器  11
    2.1.2 多核集群  11-12
    2.1.3 并行性能指标  12-13
    2.1.4 任务分解原则  13-15
  2.2 并行化开发环境  15-22
    2.2.1 共享存储模型OpenMP  15-17
    2.2.2 消息传递模型MPI  17-18
    2.2.3 线程构建模块TBB  18-20
    2.2.4 Intel Parallel Studio 高性能工具  20-22
3 线程构建模块任务调度  22-33
  3.1 任务调度器  22-26
  3.2 N 皇算法的任务并行  26-28
  3.3 测试与分析  28-32
  3.4 本章小结  32-33
4 多核集群的任务并行  33-38
  4.1 混合编程模型  33
  4.2 层次任务并行方式  33-35
  4.3 实验验证  35-37
  4.4 本章小结  37-38
5 工作分区任务并行  38-46
  5.1 OpenMP 工作分区  38
  5.2 tbb/blocked_range2d 模板类  38-39
  5.3 热点区域与并行化设计  39-42
  5.4 实验结果对比  42-45
  5.5 本章小结  45-46
结论  46-47
参考文献  47-50
攻读硕士学位期间发表学术论文情况  50-51
致谢  51

相似论文

  1. 多核集群环境下并行地理计算执行时间预测技术研究,TP338.6
  2. 基于OpenMP的遗传退火算法的并行化,TP301.6
  3. 多分辨率图像锥结合FCM的多核并行图像分割算法研究,TP391.41
  4. FDTD与MPSTD并行算法在电磁散射中的应用研究,O441.4
  5. BSD协议栈性能分析和并行优化,TP393.04
  6. 软件优化技术在软件开发项目中的应用研究,TP311.52
  7. 基于MPI和OpenMP的三维FDTD并行算法的研究,TN011
  8. 电网调度中心在线数据整合的研究和实践,TM73
  9. 基于H.264/AVC的视频编码器设计与优化,TN762
  10. 基于COM的钣金零件分拣系统设计与实现,TP391.7
  11. 并行小波高速计算研究及其在电力系统中的应用,TP338
  12. 多纹理图像分割并行算法研究与实现,TP391.41
  13. OpenMP并行编程模型与性能优化方法的研究及应用,TP311.11
  14. 多核模式下地震勘探并行计算研究,TP338.6
  15. 多核技术在网络入侵检测中的应用研究,TP393.08
  16. 基于多核系统的程序优化技术的研究,TP332
  17. OpenMP循环调度算法及SpMV多核并行化研究,TP311.11
  18. 多核集群下一种混合并行编程模型的研究,TP338.6
  19. 嵌入式多核平台并行调试器的设计与实现,TP368.1
  20. 基于有限元模型的肿瘤细胞生长的计算研究,R73-3

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 运算器和控制器(CPU)
© 2012 www.xueweilunwen.com