学位论文 > 优秀研究生学位论文题录展示
基于NoC的分布式多核系统编程模型实现
作 者: 孙思月
导 师: 王进祥
学 校: 哈尔滨工业大学
专 业: 微电子学与固体电子学
关键词: 多核 片上网络 编程模型 消息传递接口
分类号: TN47
类 型: 硕士论文
年 份: 2010年
下 载: 75次
引 用: 0次
阅 读: 论文下载
内容摘要
多核技术使处理器性能的持续增长及功耗瓶颈的突破成为可能,而片上网络为多核系统提供了优良的通信架构,保证了多核规模及复杂性的持续提升。然而,这样的架构不过是解决最终问题的基础,更重要的是如何让用户有效地利用该系统,获得多核带来的性能提升,这便依赖于良好的并行编程模型。在分析传统多核设计流程缺点的基础上,本文提出了一个优化的多核设计流程,通过将并行编程步骤独立于反复的多核设计探索过程,达到了减轻程序员的编程负担、提高设计效率的目的。为了实现该流程,本文设计了一个灵活的多核编程模型——多核消息传递接口(MPSoC Message Passing Interface,MMPI)。该模型以良好的可移植性、可扩展性以及低模型开发复杂度及开销为目标,采用基于API语言扩展方式的消息传递型并行程序编写模式,定义了一种基于映射文件的系统初始化方法以及一种分层结构的通信协议栈,通过将并行程序解耦合于映射结果及底层硬件结构,达到提高软件设计效率的目的。随后本文在一个多核全系统仿真平台上通过组织软、硬件结构实现了基于MMPI的编程、通信系统,最终提供给程序员一个包含丰富的通信和同步API、具有良好的可扩展性和可移植性的消息传递函数库。以提高系统性能及资源利用率为目标,引入了混合任务并行机制,定义了适于多核架构的通信模式,并为乱序问题提出了一种低开销的解决策略,减轻了程序员的编程负担,也为编程和通信效率的提高做出了贡献。之后本文对MMPI模型及其系统实现进行了性能评估,详细分析了系统初始化以各种通信的开销组成及特征,指出了性能瓶颈及优化方向,为使用MMPI模型的程序员及实现该模型的软件设计者提供了指导性的参考。应用并行MUSIC算法和多种规模的矩阵乘法评测了系统的加速比特性,分析了影响加速比提升的因素,证明多核编程模型的制定和实现策略对多核系统加速比和利用率的提升具有重要意义。最后结合评估结果及多核系统的特点,采用基于硬件抽象层、基于广播算法以及分级的通信模式三种策略分别从减少数据拷贝、增加通信并行度以及减少网络通信的角度对广播组通信进行了优化,在改善系统性能的同时,为任务间通信的优化提出了多种可行的策略。
|
全文目录
摘要 3-4 Abstract 4-7 第1章 绪论 7-14 1.1 课题背景及研究意义 7-8 1.2 多核编程模型研究现状 8-12 1.3 论文主要研究工作 12-13 1.4 论文结构 13-14 第2章 多核编程模型的设计 14-21 2.1 优化的多核设计流程 14-15 2.2 多核消息传递接口——MMPI 15-20 2.2.1 软件设计方法的确定 16-17 2.2.2 并行程序设计模型的确定 17-18 2.2.3 基于映射文件的系统初始化 18-19 2.2.4 分层的通信协议栈 19-20 2.3 本章小结 20-21 第3章 MMPI 的系统实现 21-34 3.1 基于NoC 的分布式多核系统结构 21-22 3.2 点对点通信 22-28 3.2.1 混合任务级并行的引入 22-23 3.2.2 点对点通信的实现 23-25 3.2.3 通信模式的设定 25-26 3.2.4 乱序问题的解决 26-28 3.3 组通信 28-32 3.3.1 组通信中通信功能的实现 29-31 3.3.2 组通信中同步功能的实现 31-32 3.3.3 组通信中计算功能的实现 32 3.4 错误控制 32-33 3.5 本章小结 33-34 第4章 性能评估 34-43 4.1 MMPI 的性能评估与分析 34-39 4.1.1 系统初始化开销评估 34-35 4.1.2 点对点通信性能评估 35-37 4.1.3 组通信性能评估 37-39 4.2 基于MMPI 的多核系统的评估 39-42 4.3 本章小结 42-43 第5章 广播组通信的优化 43-53 5.1 基于硬件抽象层的优化策略 43-45 5.2 基于MMPI 扩展层的优化策略 45-49 5.3 分级的广播策略 49-50 5.4 广播优化对并行应用性能的提升 50-52 5.5 本章小结 52-53 结论 53-54 参考文献 54-59 攻读学位期间发表的学术论文 59-61 致谢 61
|
相似论文
- 基于多核学习的高性能核分类方法研究,TP391.41
- TD-SCDMA无线链路控制协议实现研究,TN929.533
- 高速网络环境下的入侵检测系统的研究,TP393.08
- 多核系统中实时任务调度算法的研究,TP332
- 保护在线自适应整定的研究,TM77
- 多核系统中基于温度限制的节能调度算法研究,TP332
- 分布式内存多核处理器流程序虚拟机研究,TP333.1
- 面向高效NoC路由差错码设计,TN47
- 基于TILE Pro64多核处理器的3G服务器视频转码软件设计,TP393.05
- 基于TilePro64多核处理器的H.264高清视频解码软件设计,TN919.81
- 基于多核SMP集群环境的光线追踪模拟卫星成像并行研究与实现,TP391.41
- 基于多核处理机的RSA并行算法的研究与实现,TP309.7
- 基于GALS的多核互连及任务调度策略研究,TN47
- 基于广义组合多核高斯函数的图像分类方法研究,TP391.41
- 多核集群环境下并行地理计算执行时间预测技术研究,TP338.6
- 基于共享前端的流多核体系结构关键技术研究,TP332
- 面向众核温度感知的Linux调度器的研究与实现,TP316.81
- 基于群智能和冲突规避策略的基因—基因交互作用检测及其并行计算,TP391.41
- 基于NoC的软错误点到点容错机制及面向可靠性的应用映射算法研究,TP302.8
- 基于冗余传输的片上网络软错误的容错方法研究,TP302.8
- 基于多核混合支持向量机的城市短时交通预测,U491.14
中图分类: > 工业技术 > 无线电电子学、电信技术 > 微电子学、集成电路(IC) > 大规模集成电路、超大规模集成电路
© 2012 www.xueweilunwen.com
|