学位论文 > 优秀研究生学位论文题录展示

一种快速的非提取式XML解析器的设计与实现

作 者: 张运嵩
导 师: 钱培德
学 校: 苏州大学
专 业: 计算机软件与理论
关键词: XML解析 VTD-XML 非提取 复用性 并行计算
分类号: TP311.10
类 型: 硕士论文
年 份: 2010年
下 载: 126次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着XML技术的广泛应用,如何提高XML解析器的性能是一个亟待解决的问题。XML解析模型直接影响XML解析器的性能,因此解决这个问题应从XML解析模型入手。当前的研究工作大多基于提取式XML解析模型,对非提取式XML解析模型的研究很少。VTD-XML是一种新型的非提取式XML解析模型。本文在VTD-XML的基础上设计并实现了一种快速的非提取式XML解析器,称为NEM-XML。首先,NEM-XML是一种非提取式XML解析器。它抛弃了XML DOM模型中为每个XML节点创建节点对象的做法,取而代之的是使用64位长的整数保存XML节点的元信息,极大地减少了解析XML文档所需的时间和内存空间。NEM-XML以静态链表的方式组织内部的数据结构,既方便了元素节点的添加和删除,又提高了XML文档的遍历速度。其次,探索了复用XML解析结果的方法,也就是在第一次使用XML文档时进行正常的解析并将解析结果保存到二进制文件中,以后使用时直接利用二进制文件还原原始的解析结果。这在那些仅对XML文档进行访问而无更新操作的应用中有很大的实用价值。为了复用NEM-XML的解析结果,本文改进了NEM-XML的数据结构,以减少保存解析结果所需的空间以及还原解析结果所需的时间。最后,并行计算是当前的一个重点研究领域,XML并行解析也得到了越来越多的关注。本文研究了NEM-XML的并行解析算法,提出了一种受限制的XML文档划分方法,可以很快地确定各个文档片段的初始解析状态。这个划分算法兼顾XML文档的层次结构和负载平衡,划分结果比较理想。本文对XML解析技术的研究具有一定的现实意义。它不但扩展了VTD-XML所体现的非提取式XML解析思想,还进一步研究了如何复用NEM-XML的解析结果,可以促进XML在各个领域的应用。另外,本文提出的受限制的XML文档划分方法对其它XML并行解析方面的研究具有一定的参考价值。

全文目录


摘要  4-5
Abstract  5-9
第一章 绪论  9-14
  1.1 课题背景  9-10
  1.2 课题研究内容  10-12
  1.3 课题研究意义  12-13
  1.4 文章组织结构  13-14
第二章 XML解析概述  14-22
  2.1 XML的解析过程  14-15
  2.2 两种常用的XML解析模型  15-19
    2.2.1 XML DOM  16-17
    2.2.2 基于流的XML解析模型  17-19
  2.3 XML的典型应用  19
  2.4 XML解析的研究现状  19-22
第三章 VTD-XML的基本原理  22-32
  3.1 VTD Record  22-24
  3.2 LC Entry  24-26
  3.3 VTD-XML的遍历过程  26-28
  3.4 VTD-XML的更新过程  28-29
  3.5 VTD-XML的优缺点  29-31
  3.6 本章小结  31-32
第四章 NEM-XML的设计与实现  32-46
  4.1 NEM-XML的基本原理  32-35
    4.1.1 MED结构  32-34
    4.1.2 OA Record  34-35
  4.2 NEM-XML的解析过程  35-36
  4.3 NEM-XML的更新过程  36-38
  4.4 NEM-XML的遍历过程  38-39
  4.5 NEM-XML的性能分析  39-42
    4.5.1 定性分析  39-40
    4.5.2 定量分析  40-42
  4.6 实验结果与分析  42-44
  4.7 本章小结  44-46
第五章 复用NEM-XML解析结果  46-57
  5.1 复用XML解析结果的重要因素  46-47
    5.1.1 空间开销  46-47
    5.1.2 时间开销  47
  5.2 两种复用方案  47-54
    5.2.1 复用方案一:完全保存VTD Bu?er  48-50
    5.2.2 复用方案二:R-MED结构  50-54
  5.3 实验结果与分析  54-56
  5.4 本章小结  56-57
第六章 NEM-XML的并行解析算法  57-71
  6.1 XML并行解析的可行性  57-59
  6.2 XML并行解析的困难之处  59-60
  6.3 SP-NEMXML算法详解  60-65
    6.3.1 第一阶段:预解析  60-61
    6.3.2 第二阶段:并行解析  61-64
    6.3.3 预解析实验结果及分析  64-65
  6.4 RP-NEMXML算法详解  65-70
    6.4.1 划分  65-67
    6.4.2 并行解析  67-68
    6.4.3 合并解析结果  68
    6.4.4 加速比分析  68-69
    6.4.5 实验结果与分析  69-70
  6.5 本章小结  70-71
第七章 总结与展望  71-74
  7.1 总结  71-72
  7.2 展望  72-74
参考文献  74-80
攻读硕士学位期间公开发表的论文  80-81
致谢  81-82

相似论文

  1. 一种高性能可扩展公钥密码协处理器的研究与设计,TN918.1
  2. 基于多核计算平台的视频压缩算法研究,TN919.81
  3. 基于GPU的有限元方法研究,O241.82
  4. 射频波注入磁化等离子体的数值模拟,TL612
  5. 新型电网广域后备保护的算法研究,TM774
  6. 保护在线自适应整定的研究,TM77
  7. 云环境下MapReduce容错技术的研究,TP302.8
  8. 高动态SINS导航解算算法及其并行化研究,TN966
  9. 图像检索的并行计算方法与系统,TP391.3
  10. GPU加速的粒子滤波PET图像重建算法,TP391.41
  11. 基于GPU的时间序列并行检索算法研究,TP391.41
  12. 基于CPU的源强反算算法研究,TP18
  13. 面向密集数据并行计算的可重构线性阵列处理器架构的设计,TP332
  14. 基于段落指纹的大规模近似网页检测算法研究,TP393.092
  15. 并行与双系统协同差异进化算法及其应用,TP18
  16. 云计算环境下的容错并行Skyline查询技术研究,TP311.13
  17. 基于GPGPU平台的对角线模型问题研究,TP391.41
  18. CUDA加速CV图像分割和外部CT图像重建算法研究,TP391.41
  19. 无人机数码遥感测绘系统集成及影像处理研究,P237
  20. FDTD与MPSTD并行算法在电磁散射中的应用研究,O441.4
  21. 一种求解三维弹性问题有限元方程的并行DDM预条件子,O241.82

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计
© 2012 www.xueweilunwen.com