学位论文 > 优秀研究生学位论文题录展示
基于本体的异构数据集成技术研究
作 者: 潘佳云
导 师: 谢颖华
学 校: 东华大学
专 业: 通信与信息系统
关键词: 异构数据集成 本体 映射 相似度计算
分类号: TP391.1
类 型: 硕士论文
年 份: 2013年
下 载: 22次
引 用: 0次
阅 读: 论文下载
内容摘要
在智慧城市背景下,随着现代科技的不断发展进步,各企事业单位都建立了各自的信息系统,实现了数据的信息化和网络化管理。但是由于各公司存在职能上的差异,其信息系统也都是由不同的开发人员在不同时期、不同平台上开发和实施的,只考虑了系统自身的业务需求,导致系统平台、数据库技术、数据结构、查询语言等都不相同,积累了大量以不同形式存储的、依赖于不同数据库管理系统的数据,即异构数据。这些异构数据存在明显的结构异构性、分布性和自制性,使得各信息系统之间不能进行信息的共享,从而形成了“信息孤岛”。因此如何实现异构的数据集成,变得尤为重要。目前国内外已经有许多异构数据集成方案被提出,有效地解决了一些异构问题,尤其是语法上的异构。但是关于语义异构一直没有得到很好的解决。本文主要引入本体的概念来解决异构数据集成中遇到的语义异构问题。本文首先阐述了异构数据的概念和异构数据集成的目标,总结了几种典型的异构数据集成体系结构及其优缺点。之后又引入了本体的概念,总结了本体用于异构数据集成的方法及优势,给出了基于本体的异构数据集成系统的整体体系框架结构,并在此基础上讨论了集成过程中的关键问题。接着本文对本体映射进行了研究,在分析了现有本体概念相似度计算方法后,提出了一种改进型的综合领域本体相似度计算方式。该算法首先通过在世界知识体系内查找概念是否存在,避免了领域本体内概念相似度计算的局限性,同时又结合了基于概念语义、概念属性和概念结构的方式来计算综合相似度,避免计算过程的单一性和片面性,达到提高领域本体相似度准确性的目的,为本体间的映射及后续的查询扩展奠定扎实的基础。最后本文将提出的改进型综合领域本体相似度计算方法应用于个人公共事业费账务管理平台,将该算法运用于实际异构数据系统中进行了算法验证,经比较可证明该算法相比于传统的单一概念相似度算法有较高的匹配成功率和更高的匹配准确率,其综合匹配率优于单一算法。该算法的应用可屏蔽异构系统底层的异构数据,实现用户在统一的平台上“一站式”地查询个人公共事业费账单的功能,体现了改进型算法的应用价值。
|
全文目录
摘要 5-7 ABSTRACT 7-11 第一章 绪论 11-16 1.1 研究背景 11 1.2 研究现状 11-14 1.3 本文主要研究内容 14-15 1.4 本文组织结构 15-16 第二章 数据集成和相关技术 16-28 2.1 数据集成概述 16-18 2.2 本体技术 18-25 2.2.1 本体的概念 18-20 2.2.2 本体的描述 20-23 2.2.3 本体的构建工具 23-24 2.2.4 本体的存储 24-25 2.3 本体在异构数据集成中的作用 25-26 2.4 基于本体的异构数据集成方法 26-28 第三章 基于本体的异构数据集成系统总体框架研究 28-41 3.1 系统框架概述 28-29 3.2 数据层 29 3.3 中间层 29-40 3.3.1 本体库 29-34 3.3.2 映射规则库 34-39 3.3.3 查询处理模块 39-40 3.4 应用层 40-41 第四章 改进型的综合领域本体相似度计算 41-56 4.1 相似度计算概述 41-44 4.1.1 相似度定义 41 4.1.2 相似度计算方法 41-43 4.1.3 相似度计算影响因素 43-44 4.2 领域本体相似度计算 44-46 4.2.1 传统领域本体相似度计算 44-46 4.2.2 现有相似度计算方法不足 46 4.3 改进型的综合领域本体相似度计算 46-53 4.3.1 基于知网相似度计算 47-48 4.3.2 语义相似度计算 48-50 4.3.3 属性相似度计算 50-51 4.3.4 结构相似度计算 51 4.3.5 综合相似度计算 51-53 4.4 改进型算法优势 53 4.5 查询扩展 53-56 4.5.1 查询扩展概述 53-54 4.5.2 基于本体的语义查询扩展 54-56 第五章 基于本体的异构数据集成系统的应用 56-69 5.0 应用背景 56 5.1 系统集成基本原则及功能 56-57 5.2 系统异构数据库 57-58 5.3 本体构建 58-62 5.3.1 局部本体构建 58-59 5.3.2 全局本体构建 59-62 5.4 改进型综合领域本体相似度算法应用及优势 62-67 5.4.1 算法比较 62-65 5.4.2 算法评价 65-67 5.5 查询扩展 67-69 第六章 总结与展望 69-71 6.1 本文总结 69 6.2 展望 69-71 参考文献 71-75 攻读硕士学位期间发表的论文 75-76 致谢 76
|
相似论文
- 基于非规则LDPC码的BICM系统优化设计,TN911.2
- 海量多数据库集成系统的查询处理研究,TP311.13
- 多邮件自动文摘的关键技术研究,TP391.1
- AUTOSAR系统建模方法的研究与实现,TP311.52
- 基于距离映射码的安全指纹认证研究,TP391.4
- UML模型到XMI的映射方法研究,TP311.5
- 基于相似度计算的编程题自动评判方法研究,TP312.1
- 哲学思想在指导中学数学教学中的作用,G633.6
- 基于本体的语义检索研究,TP391.3
- 不同人群本体感觉差异性比较及脑机制研究,B845
- 卢卡奇《关于社会存在本体论》中的劳动范畴,B515
- 基于分布式描述逻辑的本体模块化构建方法研究,TP391.1
- 一种基于领域本体的语义Web服务匹配和组合方法,TP393.09
- WordNet和《中国分类主题词表》的映射研究,G254
- 拉图尔的行动者网络理论研究,N02
- 俄语外来词的本土化及其深层解读,H35
- 二十世纪五十至六十年代中国儿童歌曲研究,J609.2
- 伽达默尔游戏观研究,B83-0
- 低频弹性波信道多子载波调制方法研究与实现,TN919.3
- 低黄变亲水性有机硅柔软剂的开发与应用研究,TS195.23
- 基于领域本体的专利地图研究,TP391.1
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|