学位论文 > 优秀研究生学位论文题录展示
一种快速的非提取式XML解析器的设计与实现
作 者: 张运嵩
导 师: 钱培德
学 校: 苏州大学
专 业: 计算机软件与理论
关键词: XML解析 VTD-XML 非提取 复用性 并行计算
分类号: TP311.10
类 型: 硕士论文
年 份: 2010年
下 载: 126次
引 用: 0次
阅 读: 论文下载
内容摘要
随着XML技术的广泛应用,如何提高XML解析器的性能是一个亟待解决的问题。XML解析模型直接影响XML解析器的性能,因此解决这个问题应从XML解析模型入手。当前的研究工作大多基于提取式XML解析模型,对非提取式XML解析模型的研究很少。VTD-XML是一种新型的非提取式XML解析模型。本文在VTD-XML的基础上设计并实现了一种快速的非提取式XML解析器,称为NEM-XML。首先,NEM-XML是一种非提取式XML解析器。它抛弃了XML DOM模型中为每个XML节点创建节点对象的做法,取而代之的是使用64位长的整数保存XML节点的元信息,极大地减少了解析XML文档所需的时间和内存空间。NEM-XML以静态链表的方式组织内部的数据结构,既方便了元素节点的添加和删除,又提高了XML文档的遍历速度。其次,探索了复用XML解析结果的方法,也就是在第一次使用XML文档时进行正常的解析并将解析结果保存到二进制文件中,以后使用时直接利用二进制文件还原原始的解析结果。这在那些仅对XML文档进行访问而无更新操作的应用中有很大的实用价值。为了复用NEM-XML的解析结果,本文改进了NEM-XML的数据结构,以减少保存解析结果所需的空间以及还原解析结果所需的时间。最后,并行计算是当前的一个重点研究领域,XML并行解析也得到了越来越多的关注。本文研究了NEM-XML的并行解析算法,提出了一种受限制的XML文档划分方法,可以很快地确定各个文档片段的初始解析状态。这个划分算法兼顾XML文档的层次结构和负载平衡,划分结果比较理想。本文对XML解析技术的研究具有一定的现实意义。它不但扩展了VTD-XML所体现的非提取式XML解析思想,还进一步研究了如何复用NEM-XML的解析结果,可以促进XML在各个领域的应用。另外,本文提出的受限制的XML文档划分方法对其它XML并行解析方面的研究具有一定的参考价值。
|
全文目录
摘要 4-5 Abstract 5-9 第一章 绪论 9-14 1.1 课题背景 9-10 1.2 课题研究内容 10-12 1.3 课题研究意义 12-13 1.4 文章组织结构 13-14 第二章 XML解析概述 14-22 2.1 XML的解析过程 14-15 2.2 两种常用的XML解析模型 15-19 2.2.1 XML DOM 16-17 2.2.2 基于流的XML解析模型 17-19 2.3 XML的典型应用 19 2.4 XML解析的研究现状 19-22 第三章 VTD-XML的基本原理 22-32 3.1 VTD Record 22-24 3.2 LC Entry 24-26 3.3 VTD-XML的遍历过程 26-28 3.4 VTD-XML的更新过程 28-29 3.5 VTD-XML的优缺点 29-31 3.6 本章小结 31-32 第四章 NEM-XML的设计与实现 32-46 4.1 NEM-XML的基本原理 32-35 4.1.1 MED结构 32-34 4.1.2 OA Record 34-35 4.2 NEM-XML的解析过程 35-36 4.3 NEM-XML的更新过程 36-38 4.4 NEM-XML的遍历过程 38-39 4.5 NEM-XML的性能分析 39-42 4.5.1 定性分析 39-40 4.5.2 定量分析 40-42 4.6 实验结果与分析 42-44 4.7 本章小结 44-46 第五章 复用NEM-XML解析结果 46-57 5.1 复用XML解析结果的重要因素 46-47 5.1.1 空间开销 46-47 5.1.2 时间开销 47 5.2 两种复用方案 47-54 5.2.1 复用方案一:完全保存VTD Bu?er 48-50 5.2.2 复用方案二:R-MED结构 50-54 5.3 实验结果与分析 54-56 5.4 本章小结 56-57 第六章 NEM-XML的并行解析算法 57-71 6.1 XML并行解析的可行性 57-59 6.2 XML并行解析的困难之处 59-60 6.3 SP-NEMXML算法详解 60-65 6.3.1 第一阶段:预解析 60-61 6.3.2 第二阶段:并行解析 61-64 6.3.3 预解析实验结果及分析 64-65 6.4 RP-NEMXML算法详解 65-70 6.4.1 划分 65-67 6.4.2 并行解析 67-68 6.4.3 合并解析结果 68 6.4.4 加速比分析 68-69 6.4.5 实验结果与分析 69-70 6.5 本章小结 70-71 第七章 总结与展望 71-74 7.1 总结 71-72 7.2 展望 72-74 参考文献 74-80 攻读硕士学位期间公开发表的论文 80-81 致谢 81-82
|
相似论文
- 一种高性能可扩展公钥密码协处理器的研究与设计,TN918.1
- 基于多核计算平台的视频压缩算法研究,TN919.81
- 基于GPU的有限元方法研究,O241.82
- 射频波注入磁化等离子体的数值模拟,TL612
- 新型电网广域后备保护的算法研究,TM774
- 保护在线自适应整定的研究,TM77
- 云环境下MapReduce容错技术的研究,TP302.8
- 高动态SINS导航解算算法及其并行化研究,TN966
- 图像检索的并行计算方法与系统,TP391.3
- GPU加速的粒子滤波PET图像重建算法,TP391.41
- 基于GPU的时间序列并行检索算法研究,TP391.41
- 基于CPU的源强反算算法研究,TP18
- 面向密集数据并行计算的可重构线性阵列处理器架构的设计,TP332
- 基于段落指纹的大规模近似网页检测算法研究,TP393.092
- 并行与双系统协同差异进化算法及其应用,TP18
- 云计算环境下的容错并行Skyline查询技术研究,TP311.13
- 基于GPGPU平台的对角线模型问题研究,TP391.41
- CUDA加速CV图像分割和外部CT图像重建算法研究,TP391.41
- 无人机数码遥感测绘系统集成及影像处理研究,P237
- FDTD与MPSTD并行算法在电磁散射中的应用研究,O441.4
- 一种求解三维弹性问题有限元方程的并行DDM预条件子,O241.82
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计
© 2012 www.xueweilunwen.com
|