学位论文 > 优秀研究生学位论文题录展示

龙芯Ⅰ编译器中的指令调度相关优化

作 者: 蒋奕
导 师: 吴承勇
学 校: 中国科学院研究生院(计算技术研究所)
专 业: 计算机系统结构
关键词: 编译 龙芯I处理器 机器模型 静态指令调度 全局延迟槽调度
分类号: TP332
类 型: 硕士论文
年 份: 2004年
下 载: 166次
引 用: 1次
阅 读: 论文下载
 

内容摘要


指令调度相关的优化是现代编译器后端的重要组成部分。本文就通用处理器龙芯I的编译器中机器模型、静态指令调度、和全局延迟槽调度等与指令调度相关的问题进行了研究。机器模型有助于提高编译器的灵活性和可移植性,它把后端优化所需要的机器信息集中在一起并转换为后端可用的形式。本文首先介绍了现有的几种主流编译器的机器模型,包括GCC,Pro64等。然后详细的分析了ORC (Open Research Compiler)的机器模型,并通过龙芯I编译器机器模型的实际移植过程探讨了机器模型移植的一般过程和原则。静态指令调度决定指令执行顺序,屏蔽指令间由于依赖关系而产生的延迟,从而提高了指令的并行度。本文首先分析了硬件动态调度和静态指令调度之间的关系,说明了静态指令调度的必要性,然后介绍了指令调度在龙芯I编译器中的具体实现,最后给出了实验结果以说明指令调度的实际效果。由于龙芯I处理器中采用了延迟槽来减少由于分支而造成的延迟,因此优化编译器如何高效的利用延迟槽对于性能来说十分重要。本文对延迟槽调度中调度范围,所处编译阶段等问题进行了分析,对全局延迟槽调度可能出现的冲突及候选指令的区域进行了研究,提出了一种全局延迟槽调度算法,并用实验结果证明它有较好的性能和健壮性。

全文目录


摘 要  4-5
abstract  5-8
第一章 引言  8-12
  1.1 龙芯I 编译器框架简介  8-9
  1.2 机器模型  9-10
  1.3 静态指令调度  10
  1.4 全局延迟槽调度  10-11
  1.5 论文的组织  11-12
第二章 机器模型  12-21
  2.1 现有几种机器模型简介  12-14
    2.1.1 GCC 的机器模型  12-13
    2.1.2 Pro64 的机器模型  13-14
  2.2 龙芯I 编译器机器模型  14-20
    2.2.1 龙芯I 体系结构简介  14-15
    2.2.2 ORC 编译器机器模型简介  15-18
    2.2.3 机器模型的移植  18-20
  2.3 结论与展望  20-21
第三章 静态指令调度  21-34
  3.1 背景简介  21-22
  3.2 超标量机的指令调度  22-28
    3.2.1 龙芯I 处理器中的动态调度介绍  23-25
    3.2.2 龙芯I 中静态指令调度的重要性  25-28
  3.3 指令调度实现  28-32
    3.3.1 region 的构造  28-29
    3.3.2 调度区域当中基本块顺序的确定  29-30
    3.3.3 SrcBB 的选取  30
    3.3.4 候选指令的选择  30-31
    3.3.5 选择最佳候选指令  31
    3.3.6 资源相关检测和被发射指令的确定  31-32
    3.3.7 局部指令调度  32
  3.4 实验结果和分析  32-33
  3.5 展望  33-34
第四章 全局延迟槽调度  34-41
  4.1 背景介绍  34
  4.2 延迟槽调度:问题的提出和策略的选择  34-39
    4.2.1 延迟槽调度的范围  34-35
    4.2.2 延迟槽调度阶段的选择  35-36
    4.2.3 被填充指令相关问题的分析和改进  36-39
      4.2.3.1 被填充指令移动的类型和对策  36-37
      4.2.3.2 基本块之间延迟槽调度可能的冲突及预防  37-38
      4.2.3.3 候选指令范围的改进  38-39
  4.3 全局延迟槽调度算法  39
  4.4 实验结果和结论  39-40
  4.5 结论及未来工作展望  40-41
致谢  41-42
参考文献  42-44
作者简介  44
发表文章目录  44

相似论文

  1. 面向高性能DSP Matrix向量化编译器的设计与实现,TP314
  2. 基于反编译的恶意代码检测关键技术研究与实现,TP309
  3. 嵌入式MSDCC异构多核编译器研究,TP314
  4. 基于可重构平台的软硬件代码划分技术研究,TP332
  5. ARM反编译中的类型分析技术研究,TP368.1
  6. 基于GCC的ARCA3的编译器移植,TP368.1
  7. SIMD数据置换指令的自动生成与优化,TP332
  8. 面向空间目标轨道预测的定制处理器及其编译器的关键技术研究,V556
  9. 论中文企业简介的英译,H315.9
  10. C_net到可编译表达式的映射方法,TP311.52
  11. 基于设计结构矩阵的长途综合预处理系统设计与实现,TP311.52
  12. 可配置TTA处理器编译器的指令调度技术研究与实现,TP314
  13. KD-DRT中目标实时Linux的开发与集成,TP316.81
  14. 航天C程序安全规则检查技术研究,TP311.52
  15. 面向MPI程序的进程数据相似性分析与优化技术,TP311.11
  16. B/S模式C语言考试及自动评分系统的研究与实现,TP311.52
  17. 全局数组数据流分析技术的研究与实现,TP338.6
  18. 基于uClinux的针对ARM7核的嵌入式系统分析与研究,TP368.11
  19. 车铣复合加工仿真系统关键技术研究及原型系统开发,TG54
  20. 英汉新闻编译的功能途径,H315.9
  21. 基于S3C2440的嵌入式网络视频监控的实现,TP277

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 运算器和控制器(CPU)
© 2012 www.xueweilunwen.com