学位论文 > 优秀研究生学位论文题录展示
数据空间中数据资源之间关联关系发现模型研究
作 者: 董彦磊
导 师: 申德荣
学 校: 东北大学
专 业: 计算机系统结构
关键词: 数据空间 数据资源关联关系 领域本体 频繁项集
分类号: TP311.13
类 型: 硕士论文
年 份: 2009年
下 载: 15次
引 用: 0次
阅 读: 论文下载
内容摘要
关系数据库管理技术作为当今IT领域最成功的软件技术之一,已经成为了世界范围内几乎所有的商业、政务、金融和科技活动的基础。然而,随着信息技术的不断发展,计算机和互联网的不断普及,个人数据信息急剧膨胀,Web也日益成为一个巨大的信息共享平台,数据管理随之呈现出一些新的特点:一是增长迅猛;二是信息共享;三是资源多样化;四是异构分布。数据管理呈现出的这些新特点使得传统的数据库技术已不能满足新时期复杂数据管理的新要求。数据空间是针对传统数据库技术所面临的种种挑战而提出的一种新的信息管理抽象,通过提供一套相关的数据管理服务与机制,使得应用开发者可以集中精力解决特定的应用问题,而不用疲于应付反复出现的、大量相关而又各异的底层数据管理与访问。本文基于已有的数据空间研究成果,重点针对有效组织数据空间中的数据资源、挖掘数据空间中数据资源之间的关联关系以支持语义查询进行研究。首先,将数据空间分为物理层、逻辑层和应用层三层结构,提出了PAD模型和CKP模型,分别用来表示逻辑数据层中的逻辑实体和逻辑实体集合。其次,利用领域本体知识来挖掘领域层次对象之间的关联关系,然后根据属性模式信息对数据资源实体进行解析从而得到一个基于对象关键字的数据资源逻辑结构层次图。再次,将领域本体关联关系向下延伸和数据资源逻辑结构层次图进行结合,从而得到数据资源之间的直接关联关系。然后利用数据挖掘中挖掘频繁项集的方法,从基于相同关键字的逻辑实体集合中挖掘频繁项集,从中发现数据资源之间的间接关联关系。接着,引入关联关系置信度计算公式,为数据资源之间的每一个关联关系计算置信度,最终得到一个完整的带有置信度的数据空间数据资源关联关系图。利用该关联关系图可以进行数据空间的关键字查询、结构化查询和语义查询。实验主要从领域本体关联关系和逻辑实体集合对数据资源关联关系的影响、数据资源关联关系对数据空间查询的支持等方面对相关算法进行准确性和效率等方面的验证,通过这些实验验证了本文提出的模型和算法的可行性。
|
全文目录
摘要 5-6 Abstract 6-10 第1章 引言 10-16 1.1 问题提出 10-11 1.2 国内外研究现状 11-14 1.3 本文的研究内容 14 1.4 本文的组织结构 14-15 1.5 本章小结 15-16 第2章 相关概念与技术 16-30 2.1 数据空间概述 16-20 2.1.1 数据空间的基本概念 16 2.1.2 数据空间与关系数据库 16-18 2.1.3 数据空间与数据集成 18-20 2.2 数据空间的关键技术 20-28 2.2.1 数据空间的数据模型 20-21 2.2.2 数据空间的存储技术 21-22 2.2.3 数据空间的索引结构 22-23 2.2.4 数据空间的查询处理 23-25 2.2.5 数据空间的动态性 25-26 2.2.6 数据空间的原型系统 26-27 2.2.7 数据资源之间的关联关系 27-28 2.3 数据空间的设计空间 28-29 2.4 本章小结 29-30 第3章 数据空间管理系统体系结构 30-36 3.1 数据空间管理系统的体系结构 30 3.2 物理层 30-31 3.3 逻辑层 31-34 3.4 应用层 34-35 3.5 本章小结 35-36 第4章 数据资源之间关联关系的发现模型 36-48 4.1 数据组织模型 36-41 4.1.1 逻辑实体 37 4.1.2 属性重要度计算 37-39 4.1.3 基于相同关键字的逻辑实体集合 39-40 4.1.4 主属性 40-41 4.2 领域本体之间关联关系 41-42 4.3 逻辑实体之间的关联关系 42-46 4.3.1 直接关联关系 42-43 4.3.2 间接关联关系 43-46 4.4 关联关系置信度 46-47 4.5 本章小结 47-48 第5章 数据空间中的查询处理 48-58 5.1 发现与查询相关的数据源节点 48-49 5.2 查询处理 49-54 5.2.1 关键字查询 50-51 5.2.2 结构化查询 51-53 5.2.3 语义查询 53-54 5.3 查询结果排序 54-57 5.3.1 基于关键字查询的结果排序 55 5.3.2 基于结构化查询的结果排序 55-56 5.3.3 基于语义查询的结果排序 56-57 5.4 本章小结 57-58 第6章 实验分析 58-64 6.1 实验设置 58 6.1.1 实验数据源 58 6.1.2 实验环境设置 58 6.1.3 实验涉及变量 58 6.2 实验结果及分析 58-63 6.2.1 实验Ⅰ:逻辑实体集合对数据资源之间关联关系的影响 59-60 6.2.2 实验Ⅱ:领域本体关联关系对数据资源关联关系的影响 60-61 6.2.3 实验Ⅲ:频繁项集对数据资源之间关联关系的影响 61-62 6.2.4 实验Ⅳ:数据资源之间关联关系对语义查询的支持 62-63 6.2.5 实验Ⅴ:数据源选择与查询结果排序对查询准确率的影响 63 6.3 本章小结 63-64 第7章 总结及展望 64-66 7.1 本文主要工作 64-65 7.2 未来研究工作 65-66 参考文献 66-70 致谢 70-72 攻硕期间科研及发表论文情况 72
|
相似论文
- 一种基于领域本体的语义Web服务匹配和组合方法,TP393.09
- 基于领域本体的海洋环境数据仓库设计,TP311.13
- 数据空间中基于主题词汇的概率聚类算法的研究与实现,TP311.13
- 数据空间下的索引策略研究,TP311.13
- 基于P2P的空间矢量数据快速索引机制的研究,TP391.3
- 关联规则算法及其在智能药房系统中的应用研究,TP311.13
- 武警黄金部队多源空间数据集成管理技术研究,P208
- 基于矩阵的加权关联规则挖掘算法研究,TP311.13
- 高效频繁项集发现方法与Apriori的改进,TP311.13
- 省级基础地理信息更新平台的研究,P208
- 矢量地理空间数据数字水印算法与攻击性研究,P208
- 基于闭频繁项集的Web日志挖掘,TP393.092
- 中文网页热门主题获取系统的研究与实现,TP393.092
- 一种企业数据空间可视化汇聚流程建模方法与查询优化策略,TP311.13
- FDI在华区位选择与区位演变趋势分析,F832.6
- 空间数据管理中心系统的建立,P208
- 地层三维建模空间数据组织与查询优化,TP311.13
- 神经网络结构化设计与研究,TP183
- 互联网产品评论量化关键技术研究,TP391.1
- 分布式关联规则挖掘算法的研究与应用,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|