学位论文 > 优秀研究生学位论文题录展示
基于知识库的企业异构数据集成
作 者: 操牡丹
导 师: 王柏
学 校: 北京邮电大学
专 业: 计算机科学与技术
关键词: 数据集成 知识库 模式映射 规则管理
分类号: TP311.52
类 型: 硕士论文
年 份: 2010年
下 载: 101次
引 用: 0次
阅 读: 论文下载
内容摘要
近几十年来,随着科学技术的迅猛发展和信息化的推进,人类社会所积累的数据量已经超过了过去5000年的总和,数据的采集、存储、处理和传播的数量也与日俱增。企业为了实现数据共享,减少资料收集、数据采集等重复劳动和相应费用,必须首先进行数据集成。企业异构数据集成技术是将企业分布的、异构的独立信息源中的有用数据集成在一起,使得用户能够以透明的方式访问这些数据源,以供信息检索、分析处理等应用的技术。现有的集成技术主要分为逻辑集成和物理集成两种方式,对于企业中的信息,因为强调从积累的数据中分析挖掘出有商业价值的信息,更适合用物理集成的方式。物理集成过程中最重要的技术是ETL(抽取、转换和装载)技术。当前已有的一些ETL产品主要基于图形化的作业配置形式,嵌入可执行的脚本,缺少灵活的“记忆”、“推荐”等智能支持。本文从本体和规则引擎入手,研究了一套基于知识库的智能的集成方案。论文提出了一种基于知识库的数据集成框架。此框架将数据集成与知识库、规则引擎等智能技术联系起来,突出了“知识”在集成过程中的作用。论文首先给出了基于知识库的集成框架结构,分析了框架的各组成部分和其作用。接着重点研究了知识库的设计,包括语义库、映射库和规则库。提出了一种基于规则库以及历史映射信息的新的模式映射算法,以求实现模式映射的自动化。分析了规则库和规则管理的相关技术,并给出了在数据集成框架中规则引擎、规则管理等规则相关问题的解决方案。最后论文按照设计的集成框架实现了个人信息集成系统,融入了其中的所有研究点,并实现了数据查询和可视化分析功能,取得了良好效果。与已有的数据集成工具相比,论文提出的集成框架的优势在于:引入了知识库,不断积累的知识为集成的智能化提供了基础;语义库消除了集成过程中的难以解决的语义冲突问题;模式映射的半自动化功能节省了时间和人力;提供了灵活的规则配置功能;提供了可视化分析功能。
|
全文目录
摘要 4-6 Abstract 6-12 第一章 绪论 12-15 1.1 论文背景 12-13 1.2 研究现状 13-14 1.3 研究内容 14 1.4 论文结构 14-15 第二章 数据集成理论和技术 15-24 2.1 数据集成方案 15-17 2.2 ETL技术 17-20 2.2.1 数据抽取 18-19 2.2.2 数据转换 19 2.2.3 数据装载 19-20 2.3 主要数据集成工具 20-24 第三章 本体与规则引擎 24-32 3.1 本体概述 24-27 3.1.1 本体概念 24-25 3.1.2 本体的建模元语 25-26 3.1.3 本体的形式化表示 26-27 3.2 规则引擎 27-30 3.2.1 基于规则的专家系统 27-29 3.2.2 规则引擎规范和规则语言 29-30 3.3 本体与规则引擎的联系 30-32 第四章 数据集成框架和关键技术研究 32-50 4.1 基于知识库的数据集成框架 32-36 4.1.1 集成框架 32-34 4.1.2 知识库 34-36 4.2 本体语义库 36-37 4.3 规则库与规则管理 37-44 4.3.1 业务规则与规则管理系统 37-39 4.3.2 规则库设计 39-40 4.3.3 规则存储与规则引擎 40-43 4.3.4 规则管理 43-44 4.4 映射库与模式映射 44-50 4.4.1 映射库设计 44-45 4.4.2 模式映射 45-49 4.4.2.1 名称相似度 45 4.4.2.2 数据规则相似度 45-47 4.4.2.3 半自动化模式映射 47-49 4.4.3 模式映射对知识库的影响 49-50 第五章 个人信息集成系统的设计与实现 50-70 5.1 系统的逻辑架构 51-54 5.1.1 系统包图 52-54 5.2 系统数据模型设计 54-57 5.3 数据规则的设计与实现 57-60 5.3.1 数据语法规则 57-59 5.3.2 数据编码规则 59-60 5.4 半自动化模式映射 60-65 5.5 数据装载的实现 65-70 第六章 总结与展望 70-72 6.1 论文工作总结 70 6.2 下一步工作方向 70-72 参考文献 72-75 致谢 75-76 攻读学位期间发表的学术论文 76
|
相似论文
- SOA高校迎新系统中的SDO模型的研究与实现,G647
- 海量多数据库集成系统的查询处理研究,TP311.13
- 面向领域的数据库问答系统关键技术研究,TP311.13
- 制造特征提取与智能工艺决策技术研究,TH162
- 一种可视化的分布式数据集成模型的研究与实现,TP311.52
- 汉语框架自动识别中的歧义消解,TP391.1
- 面向服务的数据集成模型的研究与实现,TP311.52
- 公安信息系统中数据集成的,TP311.52
- 服装质量预测系统的软件设计与实现,TP311.52
- 四川职业技术学院档案信息管理系统的设计与实现,TP311.52
- 基于SLA的云服务自适应提供框架的研究与实现,TP311.52
- 武警黄金部队多源空间数据集成管理技术研究,P208
- 烟草病虫害防治网络信息系统研究,S435.72
- 电子化疾病护理知识库的开发研究,R47
- 基于SOA的离散数据集成技术研究,TP311.52
- 基于知识的应用生命周期管理研究,TP311.52
- 基于数据集成的人事系统设计与实现,TP311.52
- 语义Web中基于描述逻辑的多知识库整合研究,TP391.1
- 基于XML模式的异构数据集成中间件研究,TP311.52
- 多源空间数据集成方法研究,P208
- 钢铁服务企业生产管理方法研究与信息系统设计,F426.31
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 软件工程 > 软件开发
© 2012 www.xueweilunwen.com
|