学位论文 > 优秀研究生学位论文题录展示
基于XML的非结构化数据管理研究及应用
作 者: 文龙
导 师: 程京;叶柏龙
学 校: 湖南大学
专 业: 软件工程
关键词: 非结构化数据 关系数据库 XML 数据存储
分类号: TP311.13
类 型: 硕士论文
年 份: 2009年
下 载: 161次
引 用: 0次
阅 读: 论文下载
内容摘要
随着社会的进步和科技的发展,特别是Internet的广泛应用,人们要面对的信息量越来越多。统计资料表明,20%左右的结构化信息有效地存储在各种类型的结构化数据库中,但还有80%左右的非结构化信息分散在整个业务过程及外部环境中。非结构化信息已成为政府、企业等决策的依据。怎么样有效的管理好这些非结构化数据,并挖掘出这些数据的内在联系和知识重点是目前急需解决的问题。传统的数据管理特别是关系数据库系统,应用中对非结构化的数据只提供一些表层的管理;而目前对于非结构化信息的处理方式,侧重于电子化的文档的处理,缺乏对非结构化信息全生命周期和智能化的管理,实现起来较为复杂或效率较低,需要付出较为昂贵的代价。XML对非结构化数据的管理方式成为非结构化数据管理的一种经济的、简单的、可行的方式。本文通过分析Word文档、Excel文档、Web网页等非结构化数据的结构特点,创建各自对应的转换程序来读取这些非结构化数据的内容,使用不同的转换规则将其分别转换成为标准XML文档,使得对非结构化数据的管理转换为对半结构化数据的XML文档的管理;再通过以模板驱动建立XML文档数据与关系数据库的映射关系,按照一定的转换规则将XML数据转换成为结构化数据,为传统的基于关系模型的数据库所支持。本文的创新之处在于提出了XML对非结构化数据管理的设计及实现方案,该方案满足了多种类型数据融合的需要。综合文中提出的算法和过程,本文成功的实现了基于XML的长沙市中学生综合素质评价系统的开发,使中学生综合素质评价过程中所需要使用到的各类非结构化数据得到较为方便的管理。在通过进一步的完善和改进之后,本系统能够为今后中小学综合素质的评价工作做出应有的贡献。
|
全文目录
摘要 5-6 Abstract 6-10 插图索引 10-11 附表索引 11-12 第1章 绪论 12-20 1.1 研究背景及意义 12-13 1.2 国内外研究情况 13-18 1.3 本文的主要工作 18 1.4 论文组织结构 18-20 第2章 非结构化数据的管理方式与XML 技术 20-38 2.1 数据存储方案 20-22 2.1.1 结构化数据 20-21 2.1.2 非结构化数据 21 2.1.3 半结构化数据 21-22 2.2 非结构化数据的管理方式 22-30 2.2.1 文件系统对非结构化数据的管理 22-23 2.2.2 关系数据库对非结构化数据的管理 23-24 2.2.3 多媒体数据库对非结构化数据的管理 24-25 2.2.4 非结构化数据库对非结构化数据的管理 25-27 2.2.5 内容管理系统对非结构化数据的管理 27-29 2.2.6 Autonomy 对非结构化信息的管理 29-30 2.3 XML 技术 30-37 2.3.1 XML 概述及其特点 30-32 2.3.2 XML 语法结构 32-37 2.4 本章小结 37-38 第3章 基于XML 的非结构化数据管理 38-65 3.1 XML 数据的存储 39-42 3.2 非结构化数据向XML 转化 42-55 3.2.1 文本文档的XML 化处理方法 42-49 3.2.2 Excel 文档的XML 化处理方法 49-52 3.2.3 WEB 页转换为XML 的方法 52-54 3.2.4 图片、视频、声音、动画的XML 化处理方法 54-55 3.2.5 其它文档的处理方法 55 3.3 XML 数据结构化 55-64 3.3.1 XML 文档与关系数据库的映射 56-58 3.3.2 XML 文档与数据库的转换 58-64 3.4 本章小结 64-65 第4章 方案在中学生综合素质评定系统中的应用 65-75 4.1 应用背景与需求分析 65-68 4.2 系统功能架构 68-69 4.3 系统的设计与实现 69-74 4.3.1 非结构化数据向结构化数据的转换的实现 69-72 4.3.2 系统测试及应用 72-74 4.4 本章小结 74-75 结论 75-77 参考文献 77-80 致谢 80-81 附录A 攻读硕士期间所发表的学术论文 81
|
相似论文
- 基因调控网络模型描述语言研究,Q78
- 支持XML数据查询的F&B索引结构的研究,TP311.13
- LXI自动测试系统集成技术研究,TP274
- 医疗信息集成平台中HL7消息解析和存储的设计与实现,TP311.52
- 基于网络的服装款式设计系统的研究与实现,TS941.2
- 基于MDA的界面自动生成方法的研究,TP311.5
- C++代码缺陷检测系统的研究与设计,TP311.53
- 基于Web的科学计算遗留应用共享技术研究,TP393.09
- 基于XML的异构数据交换系统的设计与实现,TP311.52
- 电子公文传输管理系统在电大系统中的设计与实现,TP311.52
- 关系数据库到RDF(S)映射方法的研究,TP311.13
- 概率XML数据上关键字检索算法的研究与实现,TP391.3
- 行政审批电子监察系统数据交换的设计与实现,TP311.52
- 概率XML文档中Holistic Twig查询处理算法的研究与实现,TP311.13
- 保留语义约束的XML与关系数据库双向转换技术研究,TP311.13
- SOA架构在高校信息化系统中整合技术的应用,TP311.52
- 基于银行综合前置平台的金融服务支付系统的设计与实现,TP311.52
- 基于观察者模式的银行主动服务系统的设计与实现,TP311.52
- 江北区企业信用信息系统设计与实现,TP311.52
- 物联网业务模型描述语言的研究与实现,TN929.5
- 基于服务总线的模具企业信息集成系统,TP311.52
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|