学位论文 > 优秀研究生学位论文题录展示

一种软硬结合的预取技术研究

作 者: 张百达
导 师: 唐玉华
学 校: 国防科学技术大学
专 业: 计算机科学与技术
关键词: 高速缓存 预取 软硬件结合 SimpleScalar NPB
分类号: TP302
类 型: 硕士论文
年 份: 2008年
下 载: 116次
引 用: 0次
阅 读: 论文下载
 

内容摘要


“存储墙”问题一直是影响计算机效能的挑战性问题。随着技术的发展,处理器和存储器的速度差异不断的增大,同时多核技术使得存储瓶颈更加严重。针对Cache失效中的强制性失效和容量失效,传统的硬件预取或软件预取都不能很好的改善性能,因为硬件预取只是基于程序的历史信息来预测程序未来的行为,导致了预取过于盲目;而软件预取需要增加大量额外的预取指令,造成了预取性能不佳。软硬件结合的预取技术可以很好的结合软件预取和硬件预取的优点,但仍处于研究阶段。本文对软硬件结合的数据预取技术展开了深入研究,提出了编译指导的基于访存预取表的预取技术。为了更好地利用编译信息来指导预取,本文提出了一套可视化的Cache访问特性分析方法来研究Cache的行为规律。使用该方法对实验数据分析表明:对大数组线性访问是造成Cache失效的一个关键因素。为了提高Cache性能,文中采用了增量式的研究思路,提出了基于预取触发地址的访存预测表预取技术,将编译时的访存模式信息编码到访存指令中来指导预取的进行。该技术有效避免了传统顺序预取方法预取效率低的问题,可以有效的降低Cache失效率。同时,提出了将Evict Me和编译指导的访存预测表预取相结合的技术,用来解决预取数据的替换问题。该技术可以避免预取带来的Cache抖动问题,有效降低对访存带宽的需求。最后,我们在SimpleScalar平台上实现了上述的技术,选用了NPB测试集进行了性能的测试。测试结果表明,编译指导的访存预测表预取技术可以在有效隐藏访存延时,提高Cache命中率,减少程序的执行时间。并且在结合了Evict Me技术后,能够进一步提高存储系统的性能。

全文目录


摘要  10-11
ABSTRACT  11-12
第一章 绪论  12-16
  1.1 课题背景  12-13
  1.2 研究现状  13-14
  1.3 本文工作  14
  1.4 论文结构  14-16
第二章 相关研究工作  16-25
  2.1 基本概念  16-20
    2.1.1 局部性原理  16
    2.1.2 层次存储结构的基本概念  16-19
    2.1.3 访存模式  19-20
  2.2 相关工作  20-24
    2.2.1 预取技术  20-22
    2.2.2 软件管理的Cache技术  22-23
    2.2.3 编译器优化技术  23-24
  2.3 小结  24-25
第三章 对 Cache失效问题的研究  25-31
  3.1 现状及意义  25
  3.2 NPB的Cache行为分析  25-29
    3.2.1 可视化的分析方法  25-28
    3.2.2 分析与统计  28-29
  3.3 小结  29-31
第四章 软硬件结合的预取技术研究  31-46
  4.1 编译指导的失效时预取  31-35
    4.1.1 基本思想  32-33
    4.1.2 编译指导的失效时预取  33-35
    4.1.3 设置预取标志位的编译算法框架  35
  4.2 编译指导的基于访存预测表的预取技术  35-42
    4.2.1 基本思想  35-38
    4.2.2 对RPT技术的改进  38
    4.2.3 编译指导的RPT技术  38-41
    4.2.4 设置预取标志位的编译算法框架  41-42
  4.3 编译指导的基于访存预测表的预取+编译指导的替换策略  42-45
    4.3.1 基本思想  42
    4.3.2 实现  42-43
    4.3.3 设置替换标志位的编译算法框架  43-45
  4.4 小结  45-46
第五章 性能评测  46-57
  5.1 测试环境  46-48
    5.1.1 模拟器  46-48
    5.1.2 Benchmark  48
  5.2 测试方案  48-49
  5.3 实验结果分析  49-56
    5.3.1 编译指导的失效时预取技术性能分析  49-53
    5.3.2 编译指导的基于访存预测表的预取技术性能分析  53-54
    5.3.3 编译指导替换策略和预取的基于访存预测表的预取技术性能分析  54-56
  5.4 小结  56-57
第六章 结束语  57-59
  6.1 主要工作  57
  6.2 未来展望  57-59
致谢  59-60
参考文献  60-63
攻读硕士学位期间取得的学术成果  63-64
攻读硕士学位期间参加的科研工作  64

相似论文

  1. 基于函数动态重用的处理器性能优化研究,TP332
  2. 高效能嵌入式处理器IP核,TP332
  3. 面向星载计算机的容错并行算法研究与实现,TP302.8
  4. 分组交换网仿真技术与算法研究,TN915.09
  5. 基于SOPC的JPEG2000静止图像编码器设计,TN762
  6. 基于数据重用机制的超标量处理器分支预测研究,TP332
  7. 载流子传输特性对基于铱化合物磷光有机电致发光器件的影响,TN383.1
  8. 多媒体应用程序子字并行自动识别关键技术研究,TP391.4
  9. 基于软件Agent的提高大型数据库操纵效率机制研究,TP311.13
  10. 基于互联网的2.5维虚拟场景的研究与实现,TP391.9
  11. 广域传感器数据库中缓存与查询技术的研究,TP311.13
  12. 嵌入式处理器指令预取关键技术设计研究,TP368.11
  13. P2P VOD系统网络拓扑模型研究,TN948.64
  14. ATLAS在龙芯2F上的访存优化,TP332
  15. 嵌入式微处理器中动态可配置Cache结构的研究,TP332
  16. 基于PowerPC片上高速缓存的设计,TP333
  17. 采用基树的磁盘阵列Cache技术研究,TP333.35
  18. 嵌入式处理器取指单元关键部件低功耗技术研究,TP332
  19. 基于虚拟计算环境的内存资源共享技术研究,TP393.09
  20. 面向分布构件平台的持久化技术研究,TP311.52

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 一般性问题 > 设计与性能分析
© 2012 www.xueweilunwen.com