学位论文 > 优秀研究生学位论文题录展示
多核环境Cache一致性协议研究
作 者: 杨鹏飞
导 师: 李静梅
学 校: 哈尔滨工程大学
专 业: 计算机应用技术
关键词: 多核处理器 Cache一致性 存储系统 状态集合
分类号: TP332
类 型: 硕士论文
年 份: 2011年
下 载: 47次
引 用: 0次
阅 读: 论文下载
内容摘要
随着商业应用和科学计算对计算能力要求的不断提高,传统的单核处理器已经不能够满足各类应用对计算能力的要求,多核处理器应运而生。多核处理器与单核处理器相比,具有容易获得高主频、功耗低、通信延迟低等优点,但是同样存在着应用限制和技术挑战,其中,Cache一致性是影响多核处理器性能的一个关键问题。针对Cache一致性问题,近年来国内外的专家学者进行了大量的研究和改进工作,其中基于监听的Cache一致性协议和基于目录的Cache一致性协议是研究的重点。研究结果表明,研究人员根据处理器体系结构对一致性协议的合理改进可以有效提高系统的性能。本文介绍了国内外对Cache一致性协议研究的热点和方向。简要地介绍了多核处理器及其存储系统的相关内容、引出Cache一致性协议设计的重要性。在研究Cache工作原理、读写策略的基础上,新协议设计中将克服Cache乒乓现象纳入Cache一致性协议设计的优化方向。本文在分析了现有监听协议和目录协议原理和运行机制的基础上,得出了现有协议在多核处理器上应用的存储开销、系统资源浪费等限制,提出了一种基于D-Cache的混合写无效和写更新策略的Cache一致性协议一—MEDSIF。在MEDSIF协议中,将传统监听协议发送数据请求的流程改进为源端——D-Cache—-目的端的点对点通信方式。D-Cache具有目录功能,为一致性事务寻址和集中控制提供支持。同时,为避免Cache乒乓现象的发生,协议以处理器核中数据副本的数量为分类基础设计了状态集合,对应于两个副本之间的写操作,采用写更新方式;两个副本之外、三个或三个以上副本的写操作,采用写无效方式。最后,本文对新协议的正确性进行了论述,论述了新协议满足Cache一致性协议设计中写传播和写串行化等条件要求,同时通过GEMS多核模拟器对协议进行了性能测试。测试结果表明,新协议降低了L1 Cache的Cache失效率,同时降低了测试程序的运行时间,提高了系统的性能。
|
全文目录
摘要 5-6 Abstract 6-10 第1章 绪论 10-16 1.1 课题的背景与意义 10-11 1.2 国内外研究现状 11-14 1.3 论文主要工作 14-15 1.4 论文组织结构 15-16 第2章 多核处理器研究 16-26 2.1 多核处理器技术 16-18 2.1.1 多核处理器简介 16-17 2.1.2 多核处理器关键技术 17-18 2.2 存储体系层次结构 18-19 2.3 多核处理器存储系统 19-25 2.3.1 多核处理器组织结构 20 2.3.2 多核处理器互联结构 20-22 2.3.3 典型的多核处理器片上存储系统 22-25 2.4 本章小结 25-26 第3章 Cache一致性协议研究 26-40 3.1 Cache存储器 26-28 3.1.1 工作原理 26-27 3.1.2 读写策略 27 3.1.3 Cache乒乓现象 27-28 3.2 Cache一致性问题 28-31 3.2.1 Cache一致性问题的引出 28-30 3.2.2 Cache不一致的主要原因 30-31 3.3 现有Cache一致性协议研究 31-35 3.3.1 目录一致性协议 31-32 3.3.2 监听一致性协议 32-35 3.4 改进Cache一致性协议 35-38 3.4.1 现有一致性协议局限 35-36 3.4.2 Cache一致性协议改进 36-38 3.5 本章小结 38-40 第4章 D-Cache模型及MEDSIF协议设计 40-50 4.1 D-Cache模型设计 40-43 4.1.1 D-Cache功能设计 40-41 4.1.2 D-Cache运行机制 41 4.1.3 D-Cache目录协作 41-43 4.2 MEDSIF协议设计 43-48 4.2.1 状态集合 43 4.2.2 操作类型 43-46 4.2.3 状态转换图 46-48 4.3 本章小结 48-50 第5章 理论分析及性能测试 50-58 5.1 理论分析 50-52 5.1.1 写操作要求 50-51 5.1.2 死锁和活锁 51-52 5.2 性能测试 52-56 5.2.1 体系结构模拟器选择 52-53 5.2.2 GEMS模拟器组成和结构 53-54 5.2.3 测试过程及结果分析 54-56 5.3 本章小结 56-58 结论 58-60 参考文献 60-64 攻读硕士学位期间发表的论文和取得的科研成果 64-66 致谢 66
|
相似论文
- 基于BAP的数据压缩、操作与查询处理系统的实现,TP311.13
- 存储子系统能效计算研究,TP333
- TD-SCDMA无线链路控制协议实现研究,TN929.533
- 基于闪存的混合式存储系统研究,TP333
- 基于Hadoop的云存储系统客户端的设计与实现,TP333
- DURO:一种针对RAID-6单盘失效在线重构方法的研究,TP333
- 多核系统中基于温度限制的节能调度算法研究,TP332
- 基于Eucalyptus的对象存储系统的设计与实现,TP333
- 高性能存储系统的关键技术研究,TP333
- 存储系统主动对象实现机制研究,TP333
- 分布式内存多核处理器流程序虚拟机研究,TP333.1
- 基于TILE Pro64多核处理器的3G服务器视频转码软件设计,TP393.05
- 基于TilePro64多核处理器的H.264高清视频解码软件设计,TN919.81
- 分布式文件系统客户端的设计与实现,TP338.8
- 基于GALS的多核互连及任务调度策略研究,TN47
- FlashCache位运算替换算法的设计与实现,TP333
- BlueOcean海量存储系统客户端的设计与实现,TP333
- 基于共享前端的流多核体系结构关键技术研究,TP332
- 基于群智能和冲突规避策略的基因—基因交互作用检测及其并行计算,TP391.41
- 基于NAND FLASH的多路并行存储系统的研究与实现,TP333
- 多分辨率图像锥结合FCM的多核并行图像分割算法研究,TP391.41
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 运算器和控制器(CPU)
© 2012 www.xueweilunwen.com
|