学位论文 > 优秀研究生学位论文题录展示

原生XML数据引擎研究

作 者: 杨治
导 师: 鞠时光
学 校: 江苏大学
专 业: 计算机应用技术
关键词: XML 数据编码 压缩存储 索引结构 查询处理
分类号: TP311.13
类 型: 硕士论文
年 份: 2008年
下 载: 50次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着XML的广泛应用,XML数据量呈指数级增长,如何高效地管理这些数据成为当前急需解决的问题。目前已有一些方法,如利用文件系统或传统的关系数据库系统来存储和管理这些数据。但是这些方法并非针对XML所设计,在管理XML数据时有其局限性。因此需要针对XML数据的特征,研究适应其需要的原生XML数据管理技术。本文研究原生XML数据管理中的核心技术,并以此为基础实现了原生的XML数据引擎系统,主要做了以下工作:1.分析了常见的XML数据编码方案的优缺点,提出改进的DLN编码方案。此方案利用位模式来直接确定编码的长度,而不是DLN采用的递归插入次值的方式,从而缩短了编码长度。2.根据XML的特点,对Xindice系统的压缩存储方法进行改进,设计并实现了基于字节流的压缩存储。这种原生的XML存储方法在实现XML数据高效压缩的同时还保持了数据之间关系。3.以基于字节流的压缩存储为基础,结合改进的DLN编码,提出既能支持结构查询和又能支持值查询的复合索引结构,并给出该索引的构造算法。4.设计了XQuery查询语言核心表达式(PATH和FLWOR表达式)的文法,使用JavaCCT工具根据此文法生成词法语法分析器,进而利用该分析器由XQuery语句生成相应的语法树。5.以生成的语法树为基础实现查询表达式的处理。对于PATH表达式,除了实现通常的导航式处理之外,还根据本文采用的复合索引实现了集合式处理。对于FLWOR表达式,采用基于子句的查询处理方法,由语法树分解出表达式的各子句,然后进行相应的处理,最后得到XML文档的查询结果。

全文目录


摘要  6-7
Abstract  7-11
第1章 引言  11-21
  1.1 研究背景及意义  11-12
  1.2 XML相关概念和技术  12-16
  1.3 国内外研究现状及存在的问题  16-19
  1.4 本文的研究内容  19-21
第2章 XML数据编码设计和实现  21-31
  2.1 改进的DLN编码方案的设计  22-27
  2.2 改进的DLN编码的实现  27-28
  2.3 编码性能分析  28-31
第3章 存储模块的设计和实现  31-43
  3.1 XML数据存储设计  31-36
    3.1.1 存储的基本层次结构  31-32
    3.1.2 基于字节流的XML文档压缩存储  32-36
  3.2 XML数据存储的实现  36-40
    3.2.1 存储管理相关类  36-38
    3.2.2 基于字节流的压缩存储的实现  38-40
  3.3 压缩存储性能分析  40-43
第4章 索引模块的设计和实现  43-52
  4.1 复合索引的设计  43-46
  4.2 复合索引的实现  46-50
  4.3 复合索引空间性能分析  50-52
第5章 查询模块的设计和实现  52-76
  5.1 词法语法分析器的设计与实现  52-60
    5.1.1 词法语法分析器的设计  52-54
    5.1.2 词法语法分析器的具体实现  54-60
  5.2 查询处理的实现  60-74
    5.2.1 查询处理的基本设计  61-64
    5.2.2 PATH表达式处理模块的实现  64-69
    5.2.3 FLWOR表达式处理模块的实现  69-74
  5.3 查询性能分析  74-76
第6章 系统运行实例  76-81
第7章 结束语  81-82
致谢  82-83
参考文献  83-85
发表文章  85

相似论文

  1. 基因调控网络模型描述语言研究,Q78
  2. 支持XML数据查询的F&B索引结构的研究,TP311.13
  3. 海量多数据库集成系统的查询处理研究,TP311.13
  4. 基于BAP的数据压缩、操作与查询处理系统的实现,TP311.13
  5. LXI自动测试系统集成技术研究,TP274
  6. 基于网络的服装款式设计系统的研究与实现,TS941.2
  7. 基于MDA的界面自动生成方法的研究,TP311.5
  8. C++代码缺陷检测系统的研究与设计,TP311.53
  9. 基于Web的科学计算遗留应用共享技术研究,TP393.09
  10. 基于XML的异构数据交换系统的设计与实现,TP311.52
  11. 电子公文传输管理系统在电大系统中的设计与实现,TP311.52
  12. 概率XML数据上关键字检索算法的研究与实现,TP391.3
  13. 行政审批电子监察系统数据交换的设计与实现,TP311.52
  14. 概率XML文档中Holistic Twig查询处理算法的研究与实现,TP311.13
  15. 保留语义约束的XML与关系数据库双向转换技术研究,TP311.13
  16. SOA架构在高校信息化系统中整合技术的应用,TP311.52
  17. 基于银行综合前置平台的金融服务支付系统的设计与实现,TP311.52
  18. 基于观察者模式的银行主动服务系统的设计与实现,TP311.52
  19. 江北区企业信用信息系统设计与实现,TP311.52
  20. 物联网业务模型描述语言的研究与实现,TN929.5
  21. 不确定数据及相关性表示性实时概率查询处理,TP311.13

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com