学位论文 > 优秀研究生学位论文题录展示

谓词相关编译技术和深层代码优化

作 者: 芦运照
导 师: 张兆庆
学 校: 中国科学院研究生院(计算技术研究所)
专 业: 计算机系统结构
关键词: 条件执行 指令级并行 谓词划分图 谓词关系数据库 程序调用共享连接 数据布局
分类号: TP314
类 型: 博士论文
年 份: 2004年
下 载: 170次
引 用: 0次
阅 读: 论文下载
 

内容摘要


指令级并行在很大程度上促进了计算机体系结构的发展和进步,同时也促使计算机的性能前进了一大步,指令级并行从出现开始就成为一个热研究领域并且在很长时间内已经取得了很多研究成果;关于指令级并行极限的研究【Wall91】表明指令级并行理想的IPC(instruction per cycle)多数程序能达到5,其他的研究指出运用先进编译技术和理想的模型指令级并行的IPC能超过2位数,而实际的编译器产生的代码很难达到5个IPC,特别是对一款产品处理器。体系结构的设计不断给编译器支持以获得更高的指令级并行;谓词技术的支持在一定程度上对指令级并行增加了机会同时也有新的挑战,本文工作重点对谓词技术做了充分的研究,论述了谓词技术在编译技术中作用及其在体系结构中的地位,同时研究了EPIC体系结构相关的深层代码优化,并取得以下研究成果:1.建立条件转换的代价模型,把条件转换与误预测高的分支跳转联系起来,进行预测的指令调度,精确了条件转换的代价模型,作为谓词技术支持的一部分,使条件转换与谓词分析技术能够相辅相成。2.提出一种在区域上计算谓词关系的谓词分析技术,建立了谓词关系数据库,在IA-64开放源码研究编译器ORC中实验分析了谓词技术的性能影响,进一步分析了IA-64体系结构谓词支持技术的作用。3.提出了避免SSA表示的谓词分析方法,解决了多到达定值的谓词分析问题,适应了ORC后端代码生成的中间表示CGIR,实验表明谓词分析技术的灵活应用与准确计算对谓词的多到达定值的处理技术是高效的。4.提出并实现了谓词敏感的数据流分析框架,解决了数据流分析中存在的条件指令的定值和引用问题。谓词敏感的数据流分析产生的流分析信息一方面生成程序分析的流依赖信息,另一方面生成了活跃变量在控制流基本块之间的活跃信息,它区别谓词支持对指令调度和寄存器分配的局部影响,更能反应谓词技术在程序本身中的行为。5.提出控制流路径敏感的深层代码优化技术,在控制流的优化中容易做到的是如何消除分支,或者缩短关键路径等,而本技术把控制流路径按照程序的入口和出口对应形成不同的路径区分开来分别优化,特别对多出口的程序来说显示出优越性。6.提出LINUX操作系统下的程序调用共享连接深层优化技术,改进了对程序符号表属性的优化设置,进而对函数调用进行优化;并且适应EPIC体系结构特征对全局变量进行优化布局,减少了程序的访存开销,对存储优化效果明显。IA-64开放源码研究编译器ORC作为一个健壮灵活的研究平台为本文取得的研究成果提供了保证,谓词技术的支持是IA-64体系结构的新特点,ORC中

全文目录


摘要  4-6
Abstract  6-12
第1章 引言  12-26
  1.1 指令级并行与谓词技术  12-21
    1.1.1 指令级并行  12-15
      1.1.1.1 VLIW 体系结构  13-14
      1.1.1.2 EPIC 体系结构  14
      1.1.1.3 指令级并行的硬件新特征  14-15
    1.1.2 支持谓词技术的硬件特征  15-18
      1.1.2.1 Cydra5  15-16
      1.1.2.2 Arm体系结构  16
      1.1.2.3 HPL-PD 体系结构  16
      1.1.2.4 IMPACT 体系结构模型  16-17
      1.1.2.5 IA-64 体系结构  17
      1.1.2.6 其他系统  17-18
    1.1.3 谓词技术  18-21
  1.2 代码优化与数据布局优化  21-22
  1.3 术语介绍  22-24
  1.4 本文的贡献  24
  1.5 文章的组织  24-26
第2章 ORC 编译器研究平台  26-44
  2.1 ORC 硬件平台——IA64 体系结构  26-27
  2.2 ORC 开放源码研究编译器  27-44
    2.2.1 编译器后端优化设计  30-44
      2.2.1.1 指令调度  31-32
      2.2.1.2 指令投机  32-35
      2.2.1.3 区域编译框架  35-38
      2.2.1.4 机器模型  38-39
      2.2.1.5 轮廓信息插装  39-44
第3章 条件转换技术与谓词关系数据库  44-78
  3.1 条件转换  44-53
    3.1.1 介绍  44-46
    3.1.2 条件转换框架  46-53
      3.1.2.1 条件转换的整体组织  47-51
      3.1.2.2 条件转换的代价模型  51-53
  3.2 谓词分析与谓词关系数据库  53-76
    3.2.1 介绍  54-55
    3.2.2 谓词分析的背景及相关工作  55
    3.2.3 谓词分析技术的支持与应用  55-59
      3.2.3.1 谓词分析技术的支持  55-57
      3.2.3.2 谓词分析的应用  57-59
    3.2.4 谓词关系数据库——PRDB  59-70
      3.2.4.1 PRDB 的外部结构  59-60
      3.2.4.2 PRDB 的内部结构  60-62
      3.2.4.3 谓词关系数据库的建立  62-70
    3.2.5 设计的决策  70-71
    3.2.6 谓词关系数据库与指令调度  71-72
    3.2.7 实验数据与结果分析  72-76
    3.2.8 结论  76
  3.3 总结  76-78
第4章 谓词敏感的数据流分析技术  78-88
  4.1 介绍  78-79
  4.2 问题描述  79-81
    4.2.1 条件执行与常规数据流分析  80-81
  4.3 谓词敏感的数据流分析技术  81-82
  4.4 谓词敏感的数据流分析框架  82-86
  4.5 实验分析  86
  4.6 结论  86-88
第5章 控制流路径敏感的深层代码优化  88-97
  5.1 引言  88
  5.2 GCC 通用的函数调用约定  88-90
  5.3 IA-64 软件规范中的调用约定  90-91
  5.4 深层代码优化的寄存器种类  91-92
  5.5 控制流路径敏感的流分析与优化技术  92-94
    5.5.1 控制流路径敏感的流分析  92-93
    5.5.2 控制流路径敏感的优化  93-94
  5.6 控制流路径敏感的优化策略与实现  94
  5.7 实验结果与结论  94-97
第6章 适于 EPIC 的程序调用共享连接优化技术  97-111
  6.1 介绍  97-98
  6.2 程序调用共享连接技术  98-99
    6.2.1 相关述语  98-99
  6.3 全局函数符号调用的优化技术  99-104
    6.3.1 问题描述  99-100
    6.3.2 函数符号调用的优化技术  100-101
    6.3.3 编译单元进行优化实例  101-102
    6.3.4 实验小结  102-104
  6.4 全局变量访问的优化技术  104-110
    6.4.1 IA-64 体系结构下的数据机制  104-106
    6.4.2 全局变量的优化技术  106-107
    6.4.3 ”gp-relative”寻址优化  107-108
    6.4.4 实验数据  108-110
  6.5 总结  110-111
第7章 结论与工作展望  111-114
  7.1 文章总结  111-112
  7.2 工作展望  112-114
    7.2.1 谓词技术支持的研究  112
    7.2.2 程序调用共享连接优化技术的研究  112-114
参考文献  114-123
致谢  123-124
作者简历  124

相似论文

  1. 嵌入式视频解码器运动补偿过程的数据布局优化,TN919.81
  2. 基于iSCSI协议的网络存储技术及数据布局研究,TP333
  3. 国际商事在线仲裁裁决的承认与执行,D997.4
  4. 面向科学工作流的云数据布局方法研究,TP311.13
  5. 大规模网络存储系统数据布局策略的研究与实现,TP333
  6. YHFT-DSP编译关键技术分析及实现,TP314
  7. 面向归档数据的存储管理技术研究,TP333
  8. 并行计算的常用模型特征及其程序设计方法研究,TP338.6
  9. 基于ASIP的参数可选RISC结构汇编器以及VLIW结构汇编器设计,TP332
  10. 分组密码ASIP关键技术研究及实现,TN918.2
  11. 面向元数据服务器的数据分布策略研究,TP333
  12. MPEG-4视频编解码器的数据布局优化与多任务调度策略,TN762
  13. 指令级并行处理技术,TP332
  14. 基于谓词执行的编译优化技术的研究与实现,TP314
  15. 基于EPIC的动态同时多线程微体系结构线程调度技术研究,TP332
  16. 基于IA-64谓词执行的IF转换技术研究,TP391.1
  17. 视频压缩应用程序的性能优化研究,TN919.81
  18. 缓刑制度研究,D924.1
  19. 基于X流处理器的循环实现及优化,TP338.6
  20. 并行分组密码处理结构研究及指令系统设计,TP309.7
  21. 大规模网络存储环境中的数据布局与查询优化技术研究,TP333

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 编译程序、解释程序
© 2012 www.xueweilunwen.com