学位论文 > 优秀研究生学位论文题录展示

基于知识库的企业异构数据集成

作 者: 操牡丹
导 师: 王柏
学 校: 北京邮电大学
专 业: 计算机科学与技术
关键词: 数据集成 知识库 模式映射 规则管理
分类号: TP311.52
类 型: 硕士论文
年 份: 2010年
下 载: 101次
引 用: 0次
阅 读: 论文下载
 

内容摘要


近几十年来,随着科学技术的迅猛发展和信息化的推进,人类社会所积累的数据量已经超过了过去5000年的总和,数据的采集、存储、处理和传播的数量也与日俱增。企业为了实现数据共享,减少资料收集、数据采集等重复劳动和相应费用,必须首先进行数据集成。企业异构数据集成技术是将企业分布的、异构的独立信息源中的有用数据集成在一起,使得用户能够以透明的方式访问这些数据源,以供信息检索、分析处理等应用的技术。现有的集成技术主要分为逻辑集成和物理集成两种方式,对于企业中的信息,因为强调从积累的数据中分析挖掘出有商业价值的信息,更适合用物理集成的方式。物理集成过程中最重要的技术是ETL(抽取、转换和装载)技术。当前已有的一些ETL产品主要基于图形化的作业配置形式,嵌入可执行的脚本,缺少灵活的“记忆”、“推荐”等智能支持。本文从本体和规则引擎入手,研究了一套基于知识库的智能的集成方案。论文提出了一种基于知识库的数据集成框架。此框架将数据集成与知识库、规则引擎等智能技术联系起来,突出了“知识”在集成过程中的作用。论文首先给出了基于知识库的集成框架结构,分析了框架的各组成部分和其作用。接着重点研究了知识库的设计,包括语义库、映射库和规则库。提出了一种基于规则库以及历史映射信息的新的模式映射算法,以求实现模式映射的自动化。分析了规则库和规则管理的相关技术,并给出了在数据集成框架中规则引擎、规则管理等规则相关问题的解决方案。最后论文按照设计的集成框架实现了个人信息集成系统,融入了其中的所有研究点,并实现了数据查询和可视化分析功能,取得了良好效果。与已有的数据集成工具相比,论文提出的集成框架的优势在于:引入了知识库,不断积累的知识为集成的智能化提供了基础;语义库消除了集成过程中的难以解决的语义冲突问题;模式映射的半自动化功能节省了时间和人力;提供了灵活的规则配置功能;提供了可视化分析功能。

全文目录


摘要  4-6
Abstract  6-12
第一章 绪论  12-15
  1.1 论文背景  12-13
  1.2 研究现状  13-14
  1.3 研究内容  14
  1.4 论文结构  14-15
第二章 数据集成理论和技术  15-24
  2.1 数据集成方案  15-17
  2.2 ETL技术  17-20
    2.2.1 数据抽取  18-19
    2.2.2 数据转换  19
    2.2.3 数据装载  19-20
  2.3 主要数据集成工具  20-24
第三章 本体与规则引擎  24-32
  3.1 本体概述  24-27
    3.1.1 本体概念  24-25
    3.1.2 本体的建模元语  25-26
    3.1.3 本体的形式化表示  26-27
  3.2 规则引擎  27-30
    3.2.1 基于规则的专家系统  27-29
    3.2.2 规则引擎规范和规则语言  29-30
  3.3 本体与规则引擎的联系  30-32
第四章 数据集成框架和关键技术研究  32-50
  4.1 基于知识库的数据集成框架  32-36
    4.1.1 集成框架  32-34
    4.1.2 知识库  34-36
  4.2 本体语义库  36-37
  4.3 规则库与规则管理  37-44
    4.3.1 业务规则与规则管理系统  37-39
    4.3.2 规则库设计  39-40
    4.3.3 规则存储与规则引擎  40-43
    4.3.4 规则管理  43-44
  4.4 映射库与模式映射  44-50
    4.4.1 映射库设计  44-45
    4.4.2 模式映射  45-49
      4.4.2.1 名称相似度  45
      4.4.2.2 数据规则相似度  45-47
      4.4.2.3 半自动化模式映射  47-49
    4.4.3 模式映射对知识库的影响  49-50
第五章 个人信息集成系统的设计与实现  50-70
  5.1 系统的逻辑架构  51-54
    5.1.1 系统包图  52-54
  5.2 系统数据模型设计  54-57
  5.3 数据规则的设计与实现  57-60
    5.3.1 数据语法规则  57-59
    5.3.2 数据编码规则  59-60
  5.4 半自动化模式映射  60-65
  5.5 数据装载的实现  65-70
第六章 总结与展望  70-72
  6.1 论文工作总结  70
  6.2 下一步工作方向  70-72
参考文献  72-75
致谢  75-76
攻读学位期间发表的学术论文  76

相似论文

  1. SOA高校迎新系统中的SDO模型的研究与实现,G647
  2. 海量多数据库集成系统的查询处理研究,TP311.13
  3. 面向领域的数据库问答系统关键技术研究,TP311.13
  4. 制造特征提取与智能工艺决策技术研究,TH162
  5. 一种可视化的分布式数据集成模型的研究与实现,TP311.52
  6. 汉语框架自动识别中的歧义消解,TP391.1
  7. 面向服务的数据集成模型的研究与实现,TP311.52
  8. 公安信息系统中数据集成的,TP311.52
  9. 服装质量预测系统的软件设计与实现,TP311.52
  10. 四川职业技术学院档案信息管理系统的设计与实现,TP311.52
  11. 基于SLA的云服务自适应提供框架的研究与实现,TP311.52
  12. 武警黄金部队多源空间数据集成管理技术研究,P208
  13. 烟草病虫害防治网络信息系统研究,S435.72
  14. 电子化疾病护理知识库的开发研究,R47
  15. 基于SOA的离散数据集成技术研究,TP311.52
  16. 基于知识的应用生命周期管理研究,TP311.52
  17. 基于数据集成的人事系统设计与实现,TP311.52
  18. 语义Web中基于描述逻辑的多知识库整合研究,TP391.1
  19. 基于XML模式的异构数据集成中间件研究,TP311.52
  20. 多源空间数据集成方法研究,P208
  21. 钢铁服务企业生产管理方法研究与信息系统设计,F426.31

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 软件工程 > 软件开发
© 2012 www.xueweilunwen.com