学位论文 > 优秀研究生学位论文题录展示

片上多核处理器体系结构下的串行程序加速方法

作 者: 孙岩
导 师: 何立强
学 校: 内蒙古大学
专 业: 计算机系统结构
关键词: 串行程序 片上多核微处理器 指令窗口 缓存替换策略 子组 组竞争
分类号: TP332
类 型: 硕士论文
年 份: 2011年
下 载: 21次
引 用: 0次
阅 读: 论文下载
 

内容摘要


多核处理器经历了十几年的发展,目前已经成为处理器市场的主流。但是,由于结构性差异,传统的串行程序并不能在多处理器体系结构下获得性能提升。本文主要探讨如何在片上多核处理器体系结构下加速串行程序执行。为解决这一问题,本文主要从两个独立的方向进行尝试。片上多核处理器丰富的硬件资源为加速串行程序执行性能提供了一种新的可能。更大的指令窗口和最后一级缓存能够提升大多数串行程序的执行性能。本文中,我们提出了一种简单的虚拟窗口机制加速串行程序执行。方法的基本思想是将指令窗口中的长延迟指令发送到其它核,同时将最后一级缓存的换出块发送到其它核的空闲缓存空间中,进而形成一个较大的指令窗口和最后一级缓存。所有的传输操作对程序员是透明的。一个核可以静默的分享同一芯片上其它核的空闲硬件资源。方法的硬件开销很小且容易实现。初步实验证明该方法是提升片上多核微处理器平台下串行程序性能的有效选择。同时,本文提出了基于子组的适应性缓存替换策略用以提升缓存性能。该方法将最后一级缓存组分成多个子组,一定时间内只有一个子组为活跃组其它子组为非活跃组。当缓存失效发生时换出块仅从活跃子组中选取。同时,每个缓存组都将设置一个计数器统计缓存失效数,当计数大于给定阈值,活跃子组将切换到相邻子组。为了适应程序行为的变化,方法采取了组竞争策略,动态从阈值池中选择造成缓存失效最小的阈值。实验证明,单核情况下,该方法相比传统LRU策略获得5.5%几何平均性能提升,部分测试程序提升50%以上多核实验中获得平均6%的吞吐量提升和平均6.8%的加权加速比提升。

全文目录


摘要  4-6
ABSTRACT  6-10
图表目录  10-12
第一章 绪论  12-16
  1.1 论文研究背景及意义  12-13
  1.2 国内外研究现状分析  13-14
  1.3 主要研究目标和主要工作  14-15
  1.4 本文组织结构  15-16
第二章 用于多核处理器的虚拟窗口技术  16-28
  2.1 相关工作  16-17
  2.2 片上多核的虚拟窗口工作机制  17-24
    2.2.1 核间通信机制  18-20
    2.2.2 检测依赖指令  20-21
    2.2.3 发射窗口和寄存器文件  21-22
    2.2.4 信息报的格式  22-23
    2.2.5 从远端核中排空指令  23
    2.2.6 相关问题  23-24
  2.3 量化分析  24-27
    2.3.1 实验设计与结果分析  24-26
    2.3.2 通信延迟和开销  26-27
  2.4 本章小结  27-28
第三章 基于子组的适应性缓存替换策略  28-48
  3.1 试验方法  28-30
    3.1.1 基本配置  28-29
    3.1.2 测试基准程序  29-30
  3.2 基于子组的缓存替换策略  30-37
    3.2.1 方法动机  30-31
    3.2.2 缓存结构变化  31
    3.2.3 SRP的插入策略  31
    3.2.4 SRP的命中策略  31
    3.2.5 SRP活跃子组的轮转策略  31-33
    3.2.6 硬件实现  33
    3.2.7 抖动工作集的案例研究  33-35
    3.2.8 LRU友好型工作集的案例研究  35-36
    3.2.9 实验结果  36-37
  3.3 基于子组的适应性替换策略  37-45
    3.3.1 动态取样机制  37-38
    3.3.2 硬件实现  38-39
    3.3.3 计数器重置机制  39-40
    3.3.4 硬件开销  40
    3.3.5 阈值动态选择机制的改进  40-41
    3.3.6 对于ASRP中LRU插入策略的改进  41-42
    3.3.7 ASRP算法流程图  42-43
    3.3.8 实验结果分析  43-45
  3.4 基于子组的适应性替换策略的多核扩展  45-47
  3.5 本章小结  47-48
第四章 总结与进一步工作  48-50
  4.1 全文总结  48
  4.2 进一步工作  48-50
参考文献  50-54
致谢  54-55
攻读学位期间发表的学术论文  55

相似论文

  1. 家族性隐睾外显子组测序分析,R697.22
  2. 德惠断陷深层地层特征研究,P539.2
  3. 带有不可相容工件组的在线排序问题,O223
  4. 徐家围子沙河子组沉积体系与烃源岩预测,P618.13
  5. CDN缓存替换机制的研究与实现,TP393.01
  6. P2P流媒体系统缓存及调度策略研究,TP393.02
  7. 新疆鄯善县亚尔沙布拉克地区小热泉子组火山岩构造环境和岩石成因分析,P588.14
  8. 基于多核处理器串行程序并行化改造和性能优化,TP311.11
  9. 对等网络点播平台中的代理缓存系统,TP393.09
  10. 多媒体彩像系统的流媒体缓存代理服务器的研究与实现,TN919.82
  11. 组播密钥管理方案的研究与设计,TN918.1
  12. Web集群缓存系统中代理缓存技术的研究,TP393.05
  13. 辽西牛营子—郭家店盆地晚侏罗世土城子组同构造沉积研究,P512.2
  14. 子组卜辞人物研究,K877
  15. 延吉盆地白垩纪地层充填序列研究,P539
  16. 松辽盆地滨北地区构造样式与构造圈闭预测,P544.4
  17. 遗传性小脑型共济失调基因诊断平台的建立及新的致病基因的定位与克隆,R744.7
  18. 应用高通量测序研究儿童血液系统疾病发病机制,R725.5
  19. 一个中国汉族遗传性多发性外生性骨疣家系和三个反常性痤疮家系的致病基因突变研究,R394
  20. 高性能数字信号处理器的研究与设计,TN911

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 运算器和控制器(CPU)
© 2012 www.xueweilunwen.com