学位论文 > 优秀研究生学位论文题录展示

XML文档在关系数据库中存储与查询的实现

作 者: 张艳华
导 师: 张文东
学 校: 中国石油大学
专 业: 计算机应用技术
关键词: XML 关系数据库 XPath 查询优化
分类号: TP311.13
类 型: 硕士论文
年 份: 2010年
下 载: 42次
引 用: 0次
阅 读: 论文下载
 

内容摘要


近年来,Web上涌现了大量的XML数据,XML因自身描述能力强、格式简单,实现了结构、内容、表现这三者的分离,在各个领域都得到了非常广泛的应用。XML现已成为Web上数据表示、集成和交换的标准。基于关系数据库的存储和查询技术是目前存储和查询XML的各种方式中最成熟的一种数据管理技术。目前很多学者都已提出了各种各样的XML查询和存储管理的方式方法来对XML数据进行有效地加工、分析和处理。由于XML文档在关系数据库中的存储与查询存在着各个方面的问题,本文就此展开了深入的研究和探讨。提出了一种解决方法。该方法不必建立任何的索引结构,也不用考虑XML文档DTD的模式信息。而是将XML文档树中的全部节点信息无损的存储在一个关系表中。具体地来说,本文做了如下的主要工作:1、提出了一种不同与以往的关系存储方法,该方法是XML文档数据基于路径的存储方法,它是采用一个关系数据表完整地记录了XML文档中的所有信息,即采用一个固定的关系模式来存储结构各异的XML文档,具体存储XML文档中的各个节点、边、还有值的信息,即在关系表中存储了各个元素和属性的id、name、xlevel、attribute、cdata、parentid、xvalue和所有的元素或者属性的path信息,减少了表连接,提高了查询的效率。2、提出了一种查询处理机制,该方法基于表连接并适用于以上存储方法,并给出了相应的查询转换算法。该算法可将路径表达式转换为对应的SQL语句来处理。3、提出了一种存储方法与查询机制的优化策略。如果XML文档层次较多,就会有对相同路径的存储冗余的现象发生,当进行存储时引入一个路径关系表,可避免此情况;若XML数据进行查询的路径表达式为线性结构,则为了减少表连接的次数,可采用串匹配的方法,同时也能减少输入和输出数量。4、通过构建存储与查询系统验证本论文提出的存储转换和查询处理算法,采用网上搜集的不同大小的XML文档实例测试了文档的存储时间和查询响应时间等方面的数据,最终用数据证明,所提出的方法是可行且高效的。

全文目录


摘要  4-5
Abstract  5-8
第一章 绪论  8-13
  1.1 国内外研究现状  8-11
  1.2 本文的工作和创新点  11-12
  1.3 论文的组织  12-13
第二章 XML 的相关知识  13-26
  2.1 XML 及其特点  13-14
  2.2 XML 的语法  14-19
    2.2.1 XML 的文档结构  14-17
    2.2.2 文档类型定义  17-18
    2.2.3 XML Schema  18-19
  2.3 关系表与XML 文件结构的异同  19-21
  2.4 XML 文档查询技术简介  21-26
    2.4.1 XML 的查询语言  21
    2.4.2 XPath 的基本语法  21-24
    2.4.3 路径表达式的计算方法  24-26
第三章 存储和查询的实现方法  26-38
  3.1 基于路径的存储结构  26-28
    3.1.1 表结构  26-27
    3.1.2 表数据  27-28
  3.2 实现存储映射的算法  28-30
  3.3 XML 文档的查询转换  30-38
    3.3.1 线性路径表达式的转换方法  30-34
    3.3.2 对非线性路径表达式的处理  34-38
第四章 存储和查询的优化  38-42
  4.1 存储的优化  38-40
  4.2 查询的优化  40-42
第五章 系统实现  42-50
  5.1 总体框架  42-43
  5.2 各个模块的功能  43-47
    5.2.1 解析  43-45
    5.2.2 存储  45-46
    5.2.3 查询  46-47
  5.3 实验结果  47-50
结束语  50-52
参考文献  52-55
攻读硕士学位期间取得的学术成果  55-56
致谢  56

相似论文

  1. 基因调控网络模型描述语言研究,Q78
  2. 支持XML数据查询的F&B索引结构的研究,TP311.13
  3. 海量多数据库集成系统的查询处理研究,TP311.13
  4. LXI自动测试系统集成技术研究,TP274
  5. 基于网络的服装款式设计系统的研究与实现,TS941.2
  6. 基于MDA的界面自动生成方法的研究,TP311.5
  7. C++代码缺陷检测系统的研究与设计,TP311.53
  8. 基于Web的科学计算遗留应用共享技术研究,TP393.09
  9. 基于XML的异构数据交换系统的设计与实现,TP311.52
  10. 电子公文传输管理系统在电大系统中的设计与实现,TP311.52
  11. 关系数据库到RDF(S)映射方法的研究,TP311.13
  12. 概率XML数据上关键字检索算法的研究与实现,TP391.3
  13. 行政审批电子监察系统数据交换的设计与实现,TP311.52
  14. 概率XML文档中Holistic Twig查询处理算法的研究与实现,TP311.13
  15. 保留语义约束的XML与关系数据库双向转换技术研究,TP311.13
  16. SOA架构在高校信息化系统中整合技术的应用,TP311.52
  17. 基于银行综合前置平台的金融服务支付系统的设计与实现,TP311.52
  18. 基于观察者模式的银行主动服务系统的设计与实现,TP311.52
  19. 江北区企业信用信息系统设计与实现,TP311.52
  20. 物联网业务模型描述语言的研究与实现,TN929.5
  21. 多核环境下内存数据库查询优化的研究,TP311.13

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com