学位论文 > 优秀研究生学位论文题录展示
分布式格属性挖掘研究
作 者: 马宝辉
导 师: 许建潮
学 校: 长春工业大学
专 业: 计算机应用技术
关键词: 分布式数据挖掘 概念格 格属性挖掘 多概念格合并
分类号: TP311.13
类 型: 硕士论文
年 份: 2010年
下 载: 24次
引 用: 0次
阅 读: 论文下载
内容摘要
数据挖掘自从诞生到发展,再到日益成熟,都是国内外人工智能与知识发现的研究学者所热衷的课题方向,而在这些研究当中,大部分都是基于单一非分布式环境来进行数据挖掘,随着数据量的急速增大,挖掘的效率如何能保持较高的水平,也是充满挑战的工作。另一方面,目前国内的很多企业的数据并不是集中存储的,而是分布在各个地区、’分部当中。本论文的主要议题便是分布式数据挖掘,所以如何实现分布成为论文的主要内容。由于分布式系统中各个子结点中挖掘出来的数据,即各个子节点中的规则,在全局系统中并不一定适用,针对于这种在单个子结点中的频繁集在全局中并不一定频繁,反之,全局频繁集在各个子结点中不一定频繁的问题,采用了格理论,来解决分布式挖掘过程中的关键问题。基于格的良好数学特性,能够很好的处理分布式并行计算,所以,选择格作为处理此类问题的一种方法工具,解决了分布式数据挖掘所遇到的瓶颈,达到了将具体问题分布处理,提高效率的效果,因此本文重点论证分布式环境中基于格的属性约简方法。论文由以下几点构成:分布式数据挖掘产生的背景,以及分布式数据挖掘理论,由于格的并行计算能力很强,对格理论做了一定的阐述。详细的介绍了格理论,格属性约简理论,这其中包括了形式背景理论、超关系理论以及序和格理论。分析了分布式概念格合并的研究现状,包括自顶向下的Bordat算法、自底向上的Chein的算法以及渐进式增量算法Godin。对于分布式格属性挖掘理论,从某种程度上看是形式背景的分布式处理,对于分布式形式背景处理可以归纳为形式背景的叠值和并置,在本文中,详细的阐述了形式背景的叠值和并置算法,为概念格的分布式处理提供了强有力的依据。通过具体的实验,由分布式数据库Database A、Database B分别对概念格合并算法的两种形式(外延一致,内涵独立和内涵一致,外延独立)进行算法实现和分析,并且对于改进Godin算法的UpdateMCL算法在更新子概念格上增加了Flag标记位,缩减了更新子数据集,虽然在个别子节点上的精确度有略微下降,但是对于时间性能、效率上,有一定提升,并且在精确度和效率中找到新的平衡点。
|
全文目录
摘要 2-3 Abstract 3-6 第一章 绪论 6-9 1.1 分布式数据挖掘产生背景 6 1.2 分布式数据挖掘理论及其应用 6-7 1.3 概念格理论及分布并行处理 7-8 1.4 本文的研究内容 8-9 第二章 分布式格理论基础及研究现状 9-15 2.1 格的基础理论 9-10 2.2 概念格属性约简基础理论 10-13 2.3 分布式概念格构造研究现状 13-15 第三章 基于格的分布式约简合并运算 15-22 3.1 形式背景的分布处理 15-16 3.2 概念格的分布处理 16-21 3.3 本章小结 21-22 第四章 概念格合并的算法研究 22-33 4.1 外延一致,内涵独立概念格合并 22-25 4.2 U_(PDATE)MCL算法实现及分析 25-26 4.3 内涵一致,外延独立概念格合并 26-29 4.4 实验评价 29-31 4.5 结论 31-33 结束语 33-34 致谢 34-35 参考文献 35-38 攻读硕士学位期间研究成果 38-39
|
相似论文
- 基于粗糙概念格的多属性决策分析,O159
- 概念格的生成算法,O153.1
- 树同构的判定及树在概念格和逆矩阵中的应用,O157.5
- 保护隐私的分类挖掘技术研究,TP311.13
- 优化本体的迁移学习方法研究,TP391.1
- 概念格构造算法的研究及其在本体中的应用,TP391.1
- 基于概念格的数据挖掘方法研究,TP311.13
- 概念格的属性约简及建格算法的研究,O159
- 基于粗糙集—贝叶斯方法的分布式电网故障诊断,TM711
- 概念格理论在分布式电网故障诊断中的应用研究,TM711
- 概念格的属性约简研究,TP18
- 基于粗糙集的概念格约简和构造研究,TP18
- 基于iceberg概念格的最大频繁项集挖掘研究,TP311.13
- 移动网格安全策略存储机制研究,TN929.5
- 概念格剪枝方法研究及其在Web挖掘中的应用,TP311.13
- 基于粗糙集的网格海量数据挖掘若干关键技术研究,TP311.13
- 基于M-Agent的分布式数据挖掘研究,TP311.13
- 时间序列部分周期模式挖掘研究,TP311.13
- 基于领域本体的Web语义信息检索研究,TP391.3
- 基于关系数据库本体构建工具的研究与设计,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|