学位论文 > 优秀研究生学位论文题录展示
可重构宏流水加速器的研究与实现
作 者: 包文琦
导 师: 付宇卓
学 校: 上海交通大学
专 业: 计算机系统结构
关键词: 可重构加速器 宏流水结构 数字信号处理
分类号: TP332
类 型: 硕士论文
年 份: 2011年
下 载: 10次
引 用: 0次
阅 读: 论文下载
内容摘要
无论在科学研究领域还是功能应用方面,人们对于计算机性能的要求越来越高。传统处理器难以高效地处理大量特定应用,因此需要加速器协助完成运算。硬件加速器通过空间并行的方式,采用多个处理单元协同工作加速计算,大幅度提高了性能,但是在系统灵活性和扩展性上有所欠缺。越来越多的研究旨在提高加速系统的可扩展性和灵活性,可重构的加速器以及可扩展的加速结构已经成为研究热点。本文实现了可重构宏流水加速器,采用空间并行和时间并行两种加速方式,结合高性能和可扩展性完成对多种数字信号处理算法的加速。通过在FPGA器件上的实现以及实验验证了该加速器的功能与性能,并且采用理论推导与实验数据相结合的方式验证系统的可扩展性。本文的创新点在于:提出了一种新型宏流水Systolic加速器结构,将空间并行和时间并行相结合提高系统吞吐率以及性能;通过算法优化、多次复用数据降低了系统带宽需求;采用可重构方式改变加速部件结构、实现对多种数字信号处理算法(浮点矩阵乘法、卷积、离散余弦变换)的高效加速。该加速器在Virtex-6 XC6VLX240T FPGA上实现,能够稳定运行在200MHz的时钟频率并获得51.2 GFLOPS的峰值性能。本文的意义还在于提出了一种基于可重构器件的加速器体系并对今后的研究做了展望。
|
全文目录
摘要 3-4 ABSTRACT 4-11 第一章 绪论 11-18 1.1 课题研究背景 11-13 1.1.1 硬件加速器 11-12 1.1.2 加速结构与方法 12-13 1.2 国内外研究情况 13-15 1.2.1 硬件加速器 13-14 1.2.2 可重构加速器 14-15 1.3 课题研究目的与主要创新点 15-16 1.4 本文内容与结构 16-18 第二章 可重构加速器介绍 18-25 2.1 可重构计算的种类划分 18-20 2.2 加速器与通用处理器的互联方式 20 2.3 加速器结构 20-24 2.3.1 一维线性结构 20-21 2.3.2 网格结构 21-22 2.3.3 树状结构 22-24 2.4 本章小结 24-25 第三章 可重构宏流水加速器系统 25-38 3.1 系统总体结构 25-31 3.1.1 PCI Express 总线接口模块 26-28 3.1.2 DDR3 内存单元与接口模块 28-29 3.1.3 控制单元 29-31 3.2 宏流水结构 31-33 3.3 脉动结构 33-34 3.4 可重构系统 34-37 3.4.1 数量可重构 35 3.4.2 结构可重构 35-36 3.4.3 功能可重构 36-37 3.5 本章小结 37-38 第四章 典型算法在可重构宏流水加速器上的应用 38-50 4.1 矩阵乘法的加速方法 38-42 4.1.1 基本算法 38-39 4.1.2 算法在加速器上的映射与优化 39-42 4.2 二维卷积的加速方法 42-45 4.2.1 基本算法与加速器映射 43-44 4.2.2 通用的卷积加速方法 44-45 4.3 离散余弦变换的加速方法 45-49 4.3.1 一维DCT 基本算法及其在加速器上的映射 45-46 4.3.2 二维DCT 基本算法及其在加速器上的映射 46-49 4.4 本章小结 49-50 第五章 可重构宏流水加速器系统性能分析 50-60 5.1 本地缓存需求 50-52 5.2 二级缓存需求 52 5.3 各级带宽需求 52-56 5.3.1 BWLM-to-PE 53-54 5.3.2 BWL2-to-LMR 54-55 5.3.3 BWMEM-L2 55-56 5.3.4 BWINF 56 5.4 性能分析 56-59 5.4.1 峰值性能 57-58 5.4.2 可扩展性 58-59 5.5 本章小结 59-60 第六章 系统实现与实验结果分析 60-73 6.1 实验平台 60-61 6.2 系统实现情况 61-66 6.2.1 系统实现的基本配置 61-62 6.2.2 浮点矩阵乘法与二维浮点卷积 62-64 6.2.3 一维浮点离散余弦变换 64-65 6.2.4 二维定点离散余弦变换 65-66 6.3 系统可扩展性 66-67 6.4 实验软件环境 67-68 6.5 实验结果与比较 68-72 6.5.1 浮点矩阵乘法和二维浮点卷积 68-70 6.5.2 一维浮点离散余弦变换 70-71 6.5.3 二维定点离散余弦变换 71-72 6.6 本章小结 72-73 第七章 总结与展望 73-76 7.1 主要工作与创新点 73-74 7.2 后续工作与展望 74-76 参考文献 76-79 致谢 79-80 攻读硕士学位期间已发表或录用的论文 80-83
|
相似论文
- PCI-E数字化仪研制,TP274.2
- 处理器TI DSP VC33虚拟核的设计与实现,TP332
- AWG在诱饵防护设备中的应用,TN97
- 一种多测速雷达测量体制应答机的研制,V556
- 基于最大似然序列估计的电均衡研究和设计,TN911.5
- 基于DSP的光纤氢气传感器信号处理技术的研究,TN911.7
- MUSIC算法的DSP实现技术研究,TP368.1
- 交通测速雷达系统设计与实现,TN958
- 宽带数字中频接收机研究与设计,TN858
- 基于DSP的铁路地面信息处理系统研究,U284
- 伪码调相中断连续波雷达的信号处理系统设计及FPGA实现,TN791
- 地面合成孔径雷达成像系统数据采集及控制电路设计,TN958
- 面向数字信号处理的胚胎阵列研究,V443.1
- 一种便携式激光多普勒测速系统的研究,TN247
- 电机电能质量分析仪的研制,TM301.3
- 基于DSP的正弦波逆变电源研究,TM464
- 火炮外弹道测量及修正技术研究,TJ012.36
- 仪表着陆机载设备的数字信号处理,V241
- 基于ARM+DSP的振动数据采集系统的研制,TP274.2
- 基于线阵CCD的挠度和振动测量系统研究,TN386.5
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 运算器和控制器(CPU)
© 2012 www.xueweilunwen.com
|