学位论文 > 优秀研究生学位论文题录展示

二维SIMD结构的编译优化与功耗研究

作 者: 肖玮
导 师: 臧斌宇
学 校: 复旦大学
专 业: 计算机系统结构
关键词: 二维SIMD结构 模拟器 编译优化 功耗
分类号: TN403
类 型: 硕士论文
年 份: 2008年
下 载: 48次
引 用: 0次
阅 读: 论文下载
 

内容摘要


近年来随着多媒体应用的日益普及和多样化,这些应用对底层设备的处理能力也提出越来越高的要求,采用传统的一维SIMD结构或者为专门应用设计的ASIC已经无法满足这些应用。二维SIMD结构由于其高性能、可编程和低功耗的特性,已经引起了学术界和工业界的广泛关注,许多大公司例如:Mortorala、Intrinsity、Morphotech和Folsom等,都相继推出了采用二维SIMD结构作为多媒体加速部件的SOC。二维SIMD结构是一个由N×N的处理单元(PE)按照一定的拓扑结构连接组成的阵列结构,其同行或列上的处理单元能够以SIMD方式工作,多行或列之间并行执行,基于二维SIMD结构的并行处理能力,它常被作为多媒体加速部件与通用处理器集成在一个SOC上。虽然二维SIMD结构已经得到了越来越广泛的应用,但目前针对二维SIMD结构的编译优化技术研究却远远滞后于该结构的普及。在这种情况下,程序员只能通过手工编写内嵌汇编代码的方式利用二维SIMD结构的并行性,这就要求程序员不仅熟悉应用程序,而且还要对底层结构有深入的了解,并且具备相当的并行处理编程能力,这都极大增加了程序员的负担。同时由于没有有效编译优化技术的支持,目前针对二维SIMD结构的研究不够深入,关于二维SIMD结构的功耗特性及其与性能之间关系的研究都没有展开,这都给二维SIMD结构的更广泛应用设置了障碍,因此针对二维SIMD结构进行编译优化技术的研究具有十分重要的学术价值和现实意义。本文对目前广泛采用的二维SIMD结构软硬件进行了分析,并在此基础上设计了二维SIMD结构的模拟器、编译工具链和编译优化系统,还在编译优化系统的帮组下对二维SIMD结构的功耗特性展开了研究,本文的主要贡献如下所示:1.对目前广泛采用的二维SIMD结构软硬件特性进行了分析,总结了该类型结构的特点,并在此基础上设计了基于SimpleScalar的二维SIMD结构性能模拟器、功能模拟器和编译工具链。2.针对多媒体应用程序的特点和二维SIMD结构的特性提出了一种二维SIMD结构的编译框架和一系列的编译优化算法,不仅缓解了二维SIMD结构中普遍存在的限制问题,而且妥善处理了二维SIMD结构的三种并行性,特别是SIMD部件间的并行性,这在传统并行理论框架下并不能有效解决。3.从体系结构的角度对二维SIMD结构的功耗特性进行了研究,这为二维SIMD处理器体系结构级低功耗设计和编译器级低功耗优化研究奠定了基础。

全文目录


目录  2-4
摘要  4-5
Abstract  5-6
第一章 引言  6-10
  1.1 应用需求  6-7
  1.2 二维SIMD结构  7-8
  1.3 相关研究工作  8-9
  1.4 本文的安排  9-10
第二章 二维SIMD基准结构  10-15
  2.1 MorlphoSys体系结构  10-12
  2.2 MorlphoSys指令系统  12-13
  2.3 MorlphoSys系统操作  13-15
第三章 基准结构模拟器  15-21
  3.1 SimpleScalar模拟器  15-17
  3.2 二维SIMD结构功能模拟  17-19
    3.2.1 驱动二维SIMD指令集  17-18
    3.2.2 二维SIMD结构功能模拟  18-19
  3.3 二维SIMD结构性能模拟  19-21
    3.3.1 配置二维SIMD部件  19
    3.3.2 二维SIMD结构融入流水线  19-21
第四章 二维SIMD结构编译优化  21-36
  4.1 可行性分析  21-22
  4.2 优化预处理  22-26
    4.2.1 代码标准化  22-23
    4.2.2 回滚展开的循环  23-24
    4.2.3 消除简单条件分支  24-25
    4.2.4 变换SAD操作  25-26
  4.3 一维SIMD优化  26-31
    4.3.1 规约操作优化  26-27
    4.3.2 数据依赖分析  27-30
    4.3.3 一维SIMD优化  30-31
  4.4 二维SIMD优化  31-36
    4.4.1 公共向量优化  31-32
    4.4.2 流水线优化  32-34
    4.4.3 部署并行任务  34
    4.4.4 数据重组织  34-36
第五章 二维SIMD并行任务部署  36-45
  5.1 并行任务前驱图  37-39
    5.1.1 基本块划分  37-38
    5.1.2 并行任务前驱图  38-39
  5.2 节点分层  39-41
    5.2.1 分层驱动  40-41
    5.2.2 分层算法  41
  5.3 并行任务部署  41-45
    5.3.1 概念及表示法  41-42
    5.3.2 部署策略  42-43
    5.3.3 部署算法  43-45
第六章 实验与数据  45-51
  6.1 实验环境与方法  45-48
    6.1.1 编译工具链  45-47
    6.1.2 测试程序  47-48
  6.2 实验结果  48-50
  6.3 数据分析  50-51
第七章 二维SIMD结构功耗研究  51-58
  7.1 功耗研究现状  51
  7.2 二维SIMD结构功耗模拟  51-55
    7.2.1 参数化功耗模型  52-54
    7.2.2 动态功耗模型  54-55
    7.2.3 模型的实现  55
  7.3 测试与分析  55-57
  7.4 体系结构级功耗优化  57-58
第八章 总结与展望  58-60
  8.1 总结  58-59
  8.2 将来的工作  59-60
参考文献  60-63
发表文章目录  63-64
致谢  64-65

相似论文

  1. 自动变速器负载模拟器的设计与研究,TH132.46
  2. 低轨卫星移动信道特性模拟硬件实现,TN927.23
  3. 飞行模拟中飞行管理计算机系统CDU组件设计与仿真,TP391.9
  4. 空中目标抗干扰识别跟踪系统,TN215
  5. WCDMA终端测试仪中低功耗、低杂散频率合成器的研究与设计,TN74
  6. 多功能无线鼠标的研究与设计,TP334.2
  7. 低压低功耗CMOS模拟乘法器研究与设计,TN432
  8. SRAM软故障侦测与纠错方法研究及其电路实现,TP333.8
  9. 嵌入式手持移动设备上地理信息展示的低功耗实现,TP311.52
  10. 多音频短波信道模拟器的研究与实现,TN925
  11. 嵌入式处理器取指单元关键部件低功耗技术研究,TP332
  12. 基于65nm工艺的高性能音频∑△模数转换器的研究与实现,TN792
  13. HART无线适配器的研究与设计,TN915.05
  14. 低功耗、多主接口、多图层的液晶控制器设计,TN873.93
  15. 自适应OFDM数字基带接收器的低功耗研究,TN851
  16. 基于IPv6的无线传感器网络的移动性管理技术研究,TP212.9
  17. 基于路预测访问的低功耗高速缓存设计研究,TP333
  18. 高效能嵌入式处理器IP核,TP332
  19. InGaN太阳能电池的建模仿真与设计,TM914.4
  20. 基于嵌入式Linux系统的低功耗方案的设计与实现,TP368.1
  21. 基于PDNS的BitTorrent流量局域化算法的仿真与实现,TP393.093

中图分类: > 工业技术 > 无线电电子学、电信技术 > 微电子学、集成电路(IC) > 一般性问题 > 结构
© 2012 www.xueweilunwen.com