学位论文 > 优秀研究生学位论文题录展示

重复数据删除技术的研究与实现

作 者: 曾涛
导 师: 曾令仿
学 校: 华中科技大学
专 业: 计算机系统结构
关键词: 重复数据删除 哈希算法 备份 元数据组织
分类号: TP333
类 型: 硕士论文
年 份: 2011年
下 载: 100次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着信息数字化的快速发展与生产力的突飞猛进,当今企业对信息的存储需求也在飞速增长。尽管存储设备的销售价格在不断地下降,但远远赶不上企业内部产生和需要保存数据的攀升速度。重复数据删除技术能够删除重复的数据,实现数据的唯一实例存储,将有望解决该问题。该技术一般应用在备份、归档等集中式数据存储的系统中,能有效地节省存储空间和网络的传输带宽。目前,对文件或数据流中重复数据的查找效率始终是重复数据删除技术应用的瓶颈,为此重点对提高重复数据的查找效率进行了研究,并将重复数据删除技术融合到数据备份领域实现了高效的、稳定的数据容灾备份系统,它可以为数据提供安全的存储服务。该系统运用了多项技术来提高数据的备份和恢复性能:元数据的多级查询机制、数据缓存机制和多线程技术。元数据的多级查询机制通过使用全局Bloom Filter、二级索引缓存和磁盘哈希表来提高对重复数据的查找速度;数据缓存机制则通过对数据块的内存缓冲,可以避免对磁盘频繁的I/O操作;多线程技术可以提高系统的并发处理能力,从而在整体上提升系统的性能。测试表明,提出的重复数据删除技术能有效地提高备份和恢复性能,同时,能极大的减少冗余数据的存储,节省存储空间,提高备份容灾系统的存储效率。

全文目录


摘要  4-5
Abstract  5-8
1 绪论  8-16
  1.1 课题背景和意义  8-9
  1.2 重复数据删除技术  9-12
  1.3 国内外研究现状  12-14
  1.4 本文的主要研究内容  14
  1.5 论文的组织结构  14-16
2 重复数据删除关键技术的研究  16-33
  2.1 变长分块算法的研究与改进  16-17
  2.2 元数据的多级查询机制设计  17-27
  2.3 数据的存储和管理  27-30
  2.4 数据块缓存机制  30-31
  2.5 文件的恢复索引和日志技术  31-32
  2.6 本章小结  32-33
3 重复数据删除技术在备份软件中的实现  33-43
  3.1 系统的设计  34-36
  3.2 系统的实现  36-39
  3.3 系统的流程  39-42
  3.4 本章小结  42-43
4 测试与分析  43-48
  4.1 不同类型的文件去重率测试  43-45
  4.2 性能测试  45-47
  4.3 本章小结  47-48
5 结束语  48-50
  5.1 工作总结  48
  5.2 工作展望  48-50
致谢  50-51
参考文献  51-54

相似论文

  1. 河南公安系统网络的设计与实现,TP393.09
  2. 基于闪存的混合式存储系统研究,TP333
  3. 网络备份系统中管理控制的设计与实现,TP309.3
  4. 广域网数据压缩算法的研究与实现,TP391.41
  5. 基于负载均衡的混合型应用层组播模型研究,TP393.02
  6. TCN网关MVB模块的设计与实现,TN915.852
  7. 多机热备高可用集群的设计和研究,TP311.5
  8. 宽带远程接入服务器高可靠冗余备份关键技术的研究,TP309.3
  9. 云存储系统高效数据传输机制的研究,TP333
  10. 在线备份系统中存储服务器的研究与实现,TP333
  11. 在线重复数据删除技术的研究与实现,TP333
  12. 虚拟桌面环境下数据去冗余系统的设计与实现,TP333
  13. 云备份中的双指纹校验与多线程传输技术研究,TP309.3
  14. 支持重复数据删除的网络备份系统中存储服务器的设计与实现,TP309.3
  15. 一种快照技术的研究与实现,TP274
  16. 基于云存储的手机数据备份系统,TP309.3
  17. 基于OTDR的EPON在线监测和保护系统的研究,TN929.1
  18. 基于云技术的分布式实时数据库高性能数据存储检索机制的研究,TP311.13
  19. 分布式交换机上MVRP协议的研究与实现,TP393.04
  20. 基于半监督哈希算法的图像检索方法研究,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 存贮器
© 2012 www.xueweilunwen.com