学位论文 > 优秀研究生学位论文题录展示

对象存储控制器关键技术研究

作 者: 何水兵
导 师: 冯丹
学 校: 华中科技大学
专 业: 计算机系统结构
关键词: 网络存储 基于对象存储 对象存储控制器 交换架构 对象文件系统 对象预取 主动存储
分类号: TP333
类 型: 博士论文
年 份: 2009年
下 载: 176次
引 用: 1次
阅 读: 论文下载
 

内容摘要


对象存储系统结合了附网存储和存储区域网的优点,已成为网络存储领域研究的热点。对象存储系统由客户端、元数据服务器、对象存储设备和互连网络组成,其中对象存储设备是对象存储系统的核心。在大规模的PB级对象存储系统中,一般存在成千上万自管理的对象存储设备,单个对象存储设备的性能将会对整个对象存储系统的性能产生极大的影响。因此,设计一种高性能的对象存储设备在对象存储研究领域具有重大意义。对象存储控制器是对象存储设备的控制和管理单元,它由硬件平台和存储管理软件组成。对象存储控制器的核心技术主要包括控制器硬件体系结构、对象数据组织、对象数据预取和对象数据智能处理等四方面的关键问题。现有对象存储控制器由于对I/O应用和对象访问的特征考虑不足使得对象控制器在性能方面仍存在缺陷。因此,针对对象控制器四个方面的关键问题设计和实现新的体系结构和方法对于构建高性能的对象存储控制器尤为重要。对象存储控制器的硬件平台是软件运行的基础,它直接决定着控制器的性能。传统对象存储控制器大多数是基于通用的PC平台或者服务器平台,由于它们一般面向计算并不是面向I/O,用它们设计对象存储控制器存在不足,特别是I/O总线可能成为系统性能提高的瓶颈。针对该问题,提出了一种基于交换架构的对象存储控制器体系结构。这种体系结构能够大大提高系统总体通信带宽并且性能具有很好的扩展性。在此基础上,实现了一种基于Intel IOP315的新型专用对象存储控制器。新型对象存储控制器的主要组成是Intel 80314芯片和2个Intel Xscale 80200的高性能低功耗CPU。Intel 80314最重要特征是被设计成为一个任意端口间均能互连的桥,它可以支持任意端口到端口之间的并行数据传输。性能分析表明,由于更多的磁盘可以并行地传输对象数据,新型对象存储控制器可以有效的解决单条I/O总线下的性能瓶颈问题。在硬件平台基础上对象存储控制器利用对象文件系统进行对象组织和管理。许多对象文件系统利用传统本地文件系统管理对象,而结合了对象访问特点的专用对象文件系统具有更好的性能。EBOFS是一种专用对象文件系统,它的高性能很大程度上是通过其对象分配算法在为单个对象分配磁盘空间时尽量使数据在磁盘上连续实现的。然而,EBOFS采用的是一种单粒度对象空间预分配方法,这使得它在交错为多个对象并行分配空间时并不能很好地保持对象内数据的连续性。为了克服EBOFS的不足,提出了一种多粒度对象空间预分配方法。该方法中对象预分配粒度的选择有两种方式:根据用户告知值调整和根据分配时当前对象大小调整。对于事先知道大小的用户对象,该方法为对象建立一个预期对象大小属性,并且用户在创建对象时设置该属性值。在对象空间分配时该方法读取预期对象大小属性并尽量按该值预分配整个对象大小空间。对于事先不知道大小的用户对象,该方法将对象大小分为多个区间,对于不同对象区间的对象选择不同的预分配值,小对象按较小粒度预分配空间,较大的对象按较大粒度预分配空间。仿真实验表明,该对象预分配方法可以减少磁盘已使用空间的extent数和单个对象平均包含的extent数,可以提高磁盘已分配空间的连续度,从而提高对象访问的性能。对象预取是一种有效减少对象存储控制器访问延迟的重要方法。随着I/O速度与CPU速度差距的扩大,在对象存储控制器上进行对象预取变得越来越重要。然而,现有的预取方法集中于对象内的预取,这限制了对象存储控制器在多个对象间进行预取的能力。针对该问题,提出了一种利用对象间关系进行预取的方法。该方法使用一种称为序列模式挖掘的数据库技术获得对象访问序列中的序列规则并构造序列规则表。当请求的对象不在cache中时,该方法结合当前对象访问上下文在序列规则表中查找与当前对象相关的对象,并将不在cache中的相关对象预取到cache中来。实验结果表明,与基于分组的预取方法相比,该对象预取方法可以提高对象预测精确度和对象cache命中率。主动存储技术具有很多优势,可以减少网络通信量和降低应用程序的执行时间。然而,目前主动存储的优势在对象存储系统中不能得到充分体现。为此,提出了一种灵活的基于对象的主动存储设计。在该设计中对象存储控制器可以利用自己的处理能力参加到用户自定义任务或系统任务对数据的处理中来。用户自定义任务由客户端下载到对象存储控制器中,系统任务由对象存储控制器本身固有。此外,任务对用户数据处理时具有灵活的处理方式。一方面任务可以处理单个对象或多个对象,可以处理对象的一部分数据或全部数据;另一方面任务支持多种数据输入输出模式,即被任务处理的数据可以来自客户端或磁盘并且处理后的数据可以发送到客户端或磁盘。与此同时,对现有对象存储设备标准进行了扩展,使其包含主动存储相关的命令。实验结果表明,增加了主动存储功能后对象存储控制器可以减少应用程序执行时间。

全文目录


摘要  4-7
Abstract  7-12
1 绪论  12-28
  1.1 对象存储研究背景  12-15
  1.2 对象存储控制器  15-17
  1.3 对象存储控制器国内外研究现状  17-23
  1.4 对象存储控制器关键技术分析  23-25
  1.5 主要研究内容  25-27
  1.6 论文组织结构  27-28
2 对象存储控制器硬件体系结构  28-51
  2.1 传统体系结构及不足  28-30
  2.2 基于交换架构的新型体系结构  30-31
  2.3 新型体系结构优点  31-32
  2.4 基于INTEL IOP315的OSC实现  32-44
  2.5 双总线结构下的I/O性能分析  44-50
  2.6 本章小结  50-51
3 多粒度对象空间预分配  51-71
  3.1 对象文件系统组成  51-54
  3.2 EBOFS磁盘空间管理  54-57
  3.3 EBOFS对象空间分配方法不足  57-58
  3.4 多粒度对象空间分配方法  58-60
  3.5 性能测试  60-70
  3.6 本章小结  70-71
4 基于序列规则的对象预取  71-87
  4.1 对象间预取的必要性  71-72
  4.2 传统预取方法及存在的问题  72-73
  4.3 基于序列规则的预取方法框架  73-74
  4.4 用数据挖掘方法产生序列规则  74-82
  4.5 基于序列规则的预取算法  82-83
  4.6 性能测试  83-86
  4.7 本章小结  86-87
5 基于对象的主动存储  87-107
  5.1 主动存储概念和优势  87-89
  5.2 目前的主动存储技术及不足  89-90
  5.3 基于对象的主动存储设计  90-95
  5.4 扩展OSD标准  95-100
  5.5 OASM主动存储实现  100-102
  5.6 性能测试  102-105
  5.7 本章小结  105-107
6 全文总结  107-111
致谢  111-113
参考文献  113-122
附录1:攻读学位期间发表的学术论文目录  122-123
附录2:攻读学位期间申请的专利  123

相似论文

  1. 两级RAID高可靠分布式iSCSI网络存储系统,TP333
  2. 基于网络存储的流媒体服务器系统,TN919.8
  3. 基于Eucalyptus的对象存储系统的设计与实现,TP333
  4. 存储系统主动对象实现机制研究,TP333
  5. 在线备份系统中存储服务器的研究与实现,TP333
  6. 海量存储系统中高可用服务管理的设计与实现,TP333
  7. 基于网络存储器和机顶盒的家庭多媒体系统,TP393.02
  8. 异构网络存储统一管理系统的设计,TP393.07
  9. 基于B/S架构的信息管理系统理论研究,TP311.52
  10. 高性能iSCSI系统的设计与实现,TP333
  11. SAN存储网络安全解决方案的研究,TP393.08
  12. 基于iSCSI协议的网络存储技术及数据布局研究,TP333
  13. 部队视频监控存储系统的设计与实现,TP333
  14. 下一代交换网仿真系统的设计与实现,TP393.09
  15. 基于IP网络化视频监控技术研究,TP277
  16. 开源软件在存储区域网络中的应用,TP333
  17. 电力企业网络容灾存储系统的设计与应用研究,TP333
  18. 大规模网络存储系统数据布局策略的研究与实现,TP333
  19. 远程视频监控在冶金工业生产中的应用,TP277
  20. 嵌入式NAS系统的安全传输机制研究与设计,TP393.08
  21. 社交网站的群集存储系统的研究与设计,TP393.092

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 存贮器
© 2012 www.xueweilunwen.com