学位论文 > 优秀研究生学位论文题录展示
基于TTA内核的流处理器设计的研究
作 者: 赵丽丽
导 师: 毛志刚;谢憬
学 校: 上海交通大学
专 业: 电路与系统
关键词: 流体系架构 传输触发架构 帧内预测算法
分类号: TP332
类 型: 硕士论文
年 份: 2010年
下 载: 30次
引 用: 0次
阅 读: 论文下载
内容摘要
流处理器是基于流体系结构,按照流计算模型将应用中的计算和数据分离,并重新组织成一条流水线型的计算链,通过开发数据、指令和任务等多个层次上的并行性和充分利用各级存储层次上的局部性,从而得到较高的计算性能,特别适合数据并行性好、全局数据重用较少的计算密集型应用。文中流处理器基于传输触发体系结构(transport triggered architecture , TTA)设计。TTA结构利用数据传输触发具体操作,能够快速设计出满足特定应用的高性能嵌入式微处理器。荷兰代尔夫特理工大学(Delft University of Technology)第一个提出TTA结构,并设计出基于TTA体系结构的可配置处理器以及对应的一套半自动化的设计工具Move Framework,用来进行ASIP的开发。针对流体系结构的特点,文中选定视频编码协议H.264算法中帧内预测算法作为目标应用。经过资源、性能等方面的评估,该流处理器对帧内预测算法表现出有很好的性能,且较通用DSP性能有明显的提高。此外,在充分分析流处理器架构的特点和帧内预测算法的特点和瓶颈的基础上,提出针对此帧内预测算法流处理器的优化算法,并在Move Framework上生成此快速算法对应的流处理器。经再次验证,快速算法作用明显,进一步提高了流处理器性能。本文提出了一种针对局部计算密集型应用的一种高效处理器架构的设计方法。通过这个方法可以在TTA的架构上面实现计算量大、过程繁琐的算法,例如H.264协议中其它算法等。
|
全文目录
摘要 3-4 ABSTRACT 4-11 第一章 绪论 11-14 1.1 研究背景 11-12 1.2 研究方案 12-13 1.3 论文结构 13-14 第二章 流处理器及传输触发架构相关概念 14-33 2.1 流处理器概念 14-18 2.1.1 流处理器体系结构介绍 14-15 2.1.2 流处理器发展 15-16 2.1.3 流体系结构特点 16-18 2.2 传输触发架构的概念 18-22 2.2.1 处理器发展方向 18-19 2.2.2 传输触发架构的软件特点 19-20 2.2.3 传输触发架构的硬件特点 20-22 2.3 MOVE FRAMEWORK 22-25 2.3.1 软件子系统 23-24 2.3.2 硬件子系统 24 2.3.3 系统优化工具 24-25 2.4 设计流程 25-32 2.4.1 设计流程(DESIGN FLOW) 26-28 2.4.2 从下至上的设计流程 28-30 2.4.3 从上至下的设计流程 30-32 2.5 本章小结 32-33 第三章 H.264 帧内预测算法 33-41 3.1 H.264 帧内预测算法概述 33-40 3.1.1 H.264 编解码基本框架 33-34 3.1.2 帧内预测算法 34-36 3.1.3 INTRA4*4 模式帧内预测算法 36-37 3.1.4 INTRA4*4 算法的流程序特性 37-38 3.1.5 INTRA4*4 快速算法 38-40 3.2 本章小结 40-41 第四章 面向帧内预测算法的流处理器在 TTA 下的实现 41-52 4.1 针对帧内预测算法的流处理器设计 41-44 4.2 基于率失真算法的 INTRA4*4 算法的流处理器设计 44-50 4.2.1 目标应用输入 44 4.2.2 顺序代码生成 44-46 4.2.3 系统架构的创建 46-48 4.2.4 并行代码生成 48-49 4.2.5 性能评估优化 49 4.2.6 RTL代码生成 49-50 4.3 INTRA4*4 快速算法的流处理器设计 50-51 4.4 本章小结 51-52 第五章 流处理器性能评估与分析 52-67 5.1 处理器性能 52-65 5.1.1 基于 RDO 的流处理器的性能以及面积 52-58 5.1.2 快速帧内预测算法的性能以及面积功耗 58-65 5.2 与其他处理器比较 65-66 5.3 本章小结 66-67 第六章 总结与展望 67-68 6.1 论文总结 67 6.2 展望 67-68 参考文献 68-70 致谢 70-71 攻读硕士学位期间已发表或录用的论文 71-74 上海交通大学学位论文答辩决议书 74
|
相似论文
- 面向图像处理的可配置处理器设计与实现,TN47
- 面向AES加密的可配置处理器设计及实现,TN918.2
- H.264标准中整数余弦变换和量化算法的研究与硬件实现,TN919.81
- 数据仓库在派单式营销中应用研究,TP311.13
- 基于SOPC的可穿戴机多处理器设计,TP332
- 基于函数动态重用的处理器性能优化研究,TP332
- 处理器TI DSP VC33虚拟核的设计与实现,TP332
- 嵌入式处理器取指单元关键部件低功耗技术研究,TP332
- 面向存储器完整性验证的Cache设计,TP332
- 基于宏单元异步乘法器的研究与设计,TP332.22
- 嵌入式处理器中多媒体加速单元的研究,TP332
- 多核系统中实时任务调度算法的研究,TP332
- 高效能嵌入式处理器IP核,TP332
- 多核系统中基于温度限制的节能调度算法研究,TP332
- 基于锁感知的多处理机VCPU调度系统,TP332
- 基于JTAG的ARM11调试软件的设计与实现,TP332
- 虚拟计算环境中CPU开销的测量系统,TP332
- 基于多核的动态剖析加速方法研究,TP332
- 多处理器单调速率任务调度算法研究,TP332
- 深亚微米工艺下微处理器体系结构级功耗模型相关技术研究,TP332
- 面向密集数据并行计算的可重构线性阵列处理器架构的设计,TP332
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 运算器和控制器(CPU)
© 2012 www.xueweilunwen.com
|