学位论文 > 优秀研究生学位论文题录展示
基于XML的数据集成及查询的研究
作 者: 白敏
导 师: 姚全珠
学 校: 西安理工大学
专 业: 计算机应用技术
关键词: 异构数据库 数据集成 XML文档 ETL模型映射
分类号: TP311.10
类 型: 硕士论文
年 份: 2009年
下 载: 61次
引 用: 0次
阅 读: 论文下载
内容摘要
随着信息化时代的到来,由于企业间数据库的不断更新与完善,企业所拥有的数据库环境发生了巨大变化,这样给许多企业间的数据集成带来了极大挑战。在企业组织各个部门,往往会构建各自的软硬件支持平台以及数据格式标准,这样企业的整个信息就被分成了所谓的“信息孤岛”。因此减少“信息孤岛”,通过标准的数据表示和信息交换构成统一的信息共享平台是亟待解决的问题。基于XML的数据集成技术利用XML良好的可扩展性、自描述性、平台无关性等特点。XML为异构系统的信息交换提供了标准格式,采用XML作为数据库集成的互操作语言克服了异构系统的格式及标准的不同。利用XML能够灵活地完成绝大部分的数据集成工作。在数据集成过程中,实现数据互操作要通过转换查询或转换数据来实现。因此,建立基于XML文档的标准化模式文档即标准化DTD或XML Schema来描述各自领域内数据交换的格式更为至关重要。本文着重研究了异构数据源集成中映射模式的转换及ETL模型映射等关键问题。通过研究ETL模型相关理论,提出ETL模型映射方法以提高集成效率。研究关系数据库与XML数据的双向映射机制,构建基于XML与ETL的异构数据源整合共享平台的原型。通过对原型模型的各层进行描述,在关系数据库与XML文档互映射发布的基础上,对改进的模型映射算法进行了验证和应用,从而实现用户对数据的透明访问和统一操作以及信息的共享与集成。
|
全文目录
摘要 3-4 Abstract 4-8 1 绪论 8-14 1.1 课题研究背景 8 1.2 国内外研究现状 8-12 1.3 研究意义及内容 12 1.4 本文主要工作 12-14 2 XML与数据转换技术 14-26 2.1 XML技术 14 2.2 XQuery查询处理 14-16 2.3 关系数据库与XML数据的双向映射 16-24 2.3.1 映射机制 16-20 2.3.2 数据库模式与XML模式的映射转换 20-23 2.3.3 定义映射规则 23-24 2.4 数据集成中的ETL技术 24-25 2.5 本章小结 25-26 3 ETL模型映射方法 26-38 3.1 ETL模型相关理论 26-33 3.1.1 形式化定义 26 3.1.2 概念模型设计 26-31 3.1.3 逻辑模型设计 31-32 3.1.4 映射策略 32-33 3.2 模型映射算法 33-36 3.2.1 模型映射 33-35 3.2.2 算法分析 35-36 3.3 本章小结 36-38 4 基于XML与ETL数据集成平台的分析设计 38-46 4.1 系统分析 38-40 4.1.1 可行性分析 38 4.1.2 功能要求 38-39 4.1.3 性能要求 39 4.1.4 运行要求 39-40 4.2 集成方式与架构设计 40-44 4.2.1 数据源层 41-42 4.2.2 包装中介层 42-43 4.2.3 查询引擎层 43-44 4.2.4 应用表示层 44 4.3 本章小结 44-46 5 基于XML与ETL数据集成平台的实现 46-70 5.1 实现过程 46-48 5.1.1 开发环境 46-47 5.1.2 用例图 47 5.1.3 类图 47-48 5.2 系统实现 48-64 5.2.1 数据源管理模块 49-52 5.2.2 数据抽取模块 52-56 5.2.3 映射转换模块 56-63 5.2.4 查询表示模块 63-64 5.3 系统测试与运行 64-66 5.4 关键技术 66-69 5.5 本章小结 69-70 6 总结与展望 70-72 6.1 本文工作 70 6.2 工作展望 70-72 致谢 72-74 参考文献 74-76 附录 76
|
相似论文
- SOA高校迎新系统中的SDO模型的研究与实现,G647
- 一种可视化的分布式数据集成模型的研究与实现,TP311.52
- 面向服务的数据集成模型的研究与实现,TP311.52
- 概率XML文档中Holistic Twig查询处理算法的研究与实现,TP311.13
- 公安信息系统中数据集成的,TP311.52
- 基于异构数据库的高校设备管理系统的设计,TP311.52
- 武警黄金部队多源空间数据集成管理技术研究,P208
- 基于XML模式的异构数据集成中间件研究,TP311.52
- 基于XQuery的联系人管理系统开发,TP311.52
- 基于XML的异构数据库相互转换的研究与实现,TP311.13
- 基于XML的数据预处理关键技术研究及应用,TP311.13
- 基于多源信息的土壤侵蚀敏感性及其生态环境效应研究,S157
- 数字化校园数据库集成的研究和设计,TP311.13
- 基于本体的数据集成中关键技术研究,TP311.13
- 基于SOA的离散数据集成技术研究,TP311.52
- 基于Oracle数据集成工具的数据回流系统设计与实现,TP311.138
- 基于JBI的分布式企业服务总线的研究与实现,TP311.52
- 网络安全事件数据集成平台的设计及实现,TP311.52
- ERP数据集成的中间件技术研究,TP311.52
- 跨库检索技术研究及其在期刊检索平台中的应用,TP391.3
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计
© 2012 www.xueweilunwen.com
|