学位论文 > 优秀研究生学位论文题录展示
基于宽表的SaaS多租户数据存储机制研究
作 者: 陈维良
导 师: 张世栋
学 校: 山东大学
专 业: 计算机软件与理论
关键词: 多租户数据存储 宽表方法 模式映射 查询重写
分类号: TP393.09
类 型: 硕士论文
年 份: 2011年
下 载: 80次
引 用: 0次
阅 读: 论文下载
内容摘要
多租户数据存储是软件及服务(SaaS, Software as a Service)中一个重要的研究内容。针对SaaS应用“单实例多租赁”这一特点,人们提出了很多解决多租户数据存储问题的方法,其中基于关系数据库的模式映射技术最流行,具体又细分为私有表方法、宽表方法、扩展表方法、面向列的存储、透视表存储等方法,各种存储方法都有自己的优缺点和适用场景。宽表方法指将不同租户的数据统一共享存储,大大降低了数据存储的成本,特别适合节省运营成本要求下的面向事务处理的应用。但是由于宽表往往列数众多,因而表现为数据稀疏的特点,同时模式映射较为复杂,查询重写较为困难。宽表方法作为一种有效的SaaS多租户数据存储方案,需要进行一定的改进,在节省存储成本同时获得更好的存储空间利用率及更高的数据查询效率。本文主要针对SaaS多租户数据宽表存储方法的上述问题,从提高存储空间利用率和提高查询效率两个方面入手,提出了改进的多宽表数据存储机制,包括多宽表存储结构、多宽表模式下的模式映射机制、及基于视图定义替换的查询重写方式等。本文的主要工作及成果包括:(1)提出了多宽表数据存储结构。作为对宽表方法的改进,多宽表方法采用多个不同列数的宽表代替原有的单一宽表,从而可以根据不同租户的数据定制需求,将租户的数据分配到适合的宽表中,这样就大大减少了空值的存在,提高了数据密集程度,从而提高了数据存储空间利用率,减少了数据稀疏对数据查询带来的影响。(2)提出了多宽表方法下的模式映射机制。形式化地描述了租户定制信息及如何将租户的定制信息持久化成为对应的元数据描述。提出了参照业务需求的正态分布多宽表划分方法和基于预留列的多宽表选择方法,合理的选择宽表进行数据存储,建立了租户虚拟私有表到物理存储位置的映射。(3)提出了基于视图定义替换的查询重写方式。通过建立视图定义生成器及缓存器,对元数据进行封装保护,简化了元数据访问接口,实现了基于视图定义替换的查询重写方式,降低了模式映射的难度,提高了查询重写效率从而给提高整体查询性能。多宽表数据存储机制对宽表方法进行了有效的改进,能够实现按租户定制所需选择合适的宽表进行数据存储,提高了数据密集程度,降低了数据稀疏对存储空间和查询效率的影响,视图定义、缓存及基于视图定义替换的查询重写方式,对元数据进行了有效地封装和保护,降低了查询重写难度,提高了查询重写效率,从而在保持存储成本较低的同时提高了整体空间利用率和查询效率。
|
全文目录
摘要 8-10 ABSTRACT 10-12 第一章 绪论 12-20 1.1 研究背景 12-13 1.2 研究现状 13-17 1.3 研究内容 17-18 1.4 主要工作 18 1.5 本文组织结构 18-20 第二章 多宽表数据存储机制 20-31 2.1 宽表存储机制 20-24 2.1.1 存储架构 20-22 2.1.2 特点分析 22-24 2.2 多宽表数据存储机制 24-30 2.2.1 多宽表机制对传统宽表机制的改进 24-28 2.2.2 多宽表机制中的模式映射和查询重写 28-30 2.3 本章小结 30-31 第三章 多宽表存储机制中的模式映射 31-39 3.1 多宽表划分 31-34 3.1.1 多宽表划分准则 31-33 3.1.2 多宽表划分算法 33-34 3.2 租户定制信息持久化 34-37 3.2.1 多宽表选择 34-36 3.2.2 定制信息持久化 36-37 3.3 本章小结 37-39 第四章 多宽表存储机制中的查询重写 39-45 4.1 视图SQL定义的生成和缓存 39-41 4.1.1 视图SQL定义生成 39-40 4.1.2 视图SQL定义缓存 40-41 4.2 查询重写 41-43 4.3 本章小结 43-45 第五章 实验分析 45-52 5.1 存储空间利用率分析 45-46 5.2 查询效率分析 46-50 5.3 本章小结 50-52 第六章 总结展望 52-55 6.1 本文总结 52-53 6.2 展望 53-55 参考文献 55-59 致谢 59-60 攻读硕士学位期间发表的论文 60-61 攻读硕士学位期间参与的科研项目 61-62 学位论文评阅及答辩情况表 62
|
相似论文
- 海量多数据库集成系统的查询处理研究,TP311.13
- 列存储数据仓库中的查询重写关键技术的研究与实现,TP311.13
- 异构数据库系统中的查询分解与并发控制方法研究,TP311.13
- 分布式环境下的语义查询推理,TP311.13
- 多租户环境下的数据存储模式和映射机制研究,TP393.09
- 装备保障异构数据集成关键技术研究与集成环境设计,TP311.52
- 基于元数据的分布式异构数据库集成查询工具研究与开发,TP311.13
- 信息集成系统中查询优化与处理,TP311.52
- XML文档管理系统的研究与实现,TP311.52
- SaaS应用交付平台中多租户云数据管理关键技术研究,TP393.09
- 异构信息集成中的查询处理与优化研究,TP311.11
- LAV数据集成系统的查询处理,TP311.52
- 基于XML的物流元数据存储的研究,TP312.2
- 基于模式的XML查询重写及索引技术研究,TP312.2
- 企业应用系统中不确定性数据集成研究,TP311.13
- 基于知识库的企业异构数据集成,TP311.52
- 基于模式映射的XML与关系数据库的存储技术的研究,TP311.13
- 无线传感器网络中面向节能的多查询优化研究,TN929.5
- 数据库中查询重写及基于遗传算法的多连接查询优化研究,TP311.13
- 基于XML的异构数据交换技术研究,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序
© 2012 www.xueweilunwen.com
|