学位论文 > 优秀研究生学位论文题录展示

分布式格属性挖掘研究

作 者: 马宝辉
导 师: 许建潮
学 校: 长春工业大学
专 业: 计算机应用技术
关键词: 分布式数据挖掘 概念格 格属性挖掘 多概念格合并
分类号: TP311.13
类 型: 硕士论文
年 份: 2010年
下 载: 24次
引 用: 0次
阅 读: 论文下载
 

内容摘要


数据挖掘自从诞生到发展,再到日益成熟,都是国内外人工智能与知识发现的研究学者所热衷的课题方向,而在这些研究当中,大部分都是基于单一非分布式环境来进行数据挖掘,随着数据量的急速增大,挖掘的效率如何能保持较高的水平,也是充满挑战的工作。另一方面,目前国内的很多企业的数据并不是集中存储的,而是分布在各个地区、’分部当中。本论文的主要议题便是分布式数据挖掘,所以如何实现分布成为论文的主要内容。由于分布式系统中各个子结点中挖掘出来的数据,即各个子节点中的规则,在全局系统中并不一定适用,针对于这种在单个子结点中的频繁集在全局中并不一定频繁,反之,全局频繁集在各个子结点中不一定频繁的问题,采用了格理论,来解决分布式挖掘过程中的关键问题。基于格的良好数学特性,能够很好的处理分布式并行计算,所以,选择格作为处理此类问题的一种方法工具,解决了分布式数据挖掘所遇到的瓶颈,达到了将具体问题分布处理,提高效率的效果,因此本文重点论证分布式环境中基于格的属性约简方法。论文由以下几点构成:分布式数据挖掘产生的背景,以及分布式数据挖掘理论,由于格的并行计算能力很强,对格理论做了一定的阐述。详细的介绍了格理论,格属性约简理论,这其中包括了形式背景理论、超关系理论以及序和格理论。分析了分布式概念格合并的研究现状,包括自顶向下的Bordat算法、自底向上的Chein的算法以及渐进式增量算法Godin。对于分布式格属性挖掘理论,从某种程度上看是形式背景的分布式处理,对于分布式形式背景处理可以归纳为形式背景的叠值和并置,在本文中,详细的阐述了形式背景的叠值和并置算法,为概念格的分布式处理提供了强有力的依据。通过具体的实验,由分布式数据库Database A、Database B分别对概念格合并算法的两种形式(外延一致,内涵独立和内涵一致,外延独立)进行算法实现和分析,并且对于改进Godin算法的UpdateMCL算法在更新子概念格上增加了Flag标记位,缩减了更新子数据集,虽然在个别子节点上的精确度有略微下降,但是对于时间性能、效率上,有一定提升,并且在精确度和效率中找到新的平衡点。

全文目录


摘要  2-3
Abstract  3-6
第一章 绪论  6-9
  1.1 分布式数据挖掘产生背景  6
  1.2 分布式数据挖掘理论及其应用  6-7
  1.3 概念格理论及分布并行处理  7-8
  1.4 本文的研究内容  8-9
第二章 分布式格理论基础及研究现状  9-15
  2.1 格的基础理论  9-10
  2.2 概念格属性约简基础理论  10-13
  2.3 分布式概念格构造研究现状  13-15
第三章 基于格的分布式约简合并运算  15-22
  3.1 形式背景的分布处理  15-16
  3.2 概念格的分布处理  16-21
  3.3 本章小结  21-22
第四章 概念格合并的算法研究  22-33
  4.1 外延一致,内涵独立概念格合并  22-25
  4.2 U_(PDATE)MCL算法实现及分析  25-26
  4.3 内涵一致,外延独立概念格合并  26-29
  4.4 实验评价  29-31
  4.5 结论  31-33
结束语  33-34
致谢  34-35
参考文献  35-38
攻读硕士学位期间研究成果  38-39

相似论文

  1. 基于粗糙概念格的多属性决策分析,O159
  2. 概念格的生成算法,O153.1
  3. 树同构的判定及树在概念格和逆矩阵中的应用,O157.5
  4. 保护隐私的分类挖掘技术研究,TP311.13
  5. 优化本体的迁移学习方法研究,TP391.1
  6. 概念格构造算法的研究及其在本体中的应用,TP391.1
  7. 基于概念格的数据挖掘方法研究,TP311.13
  8. 概念格的属性约简及建格算法的研究,O159
  9. 基于粗糙集—贝叶斯方法的分布式电网故障诊断,TM711
  10. 概念格理论在分布式电网故障诊断中的应用研究,TM711
  11. 概念格的属性约简研究,TP18
  12. 基于粗糙集的概念格约简和构造研究,TP18
  13. 基于iceberg概念格的最大频繁项集挖掘研究,TP311.13
  14. 移动网格安全策略存储机制研究,TN929.5
  15. 概念格剪枝方法研究及其在Web挖掘中的应用,TP311.13
  16. 基于粗糙集的网格海量数据挖掘若干关键技术研究,TP311.13
  17. 基于M-Agent的分布式数据挖掘研究,TP311.13
  18. 时间序列部分周期模式挖掘研究,TP311.13
  19. 基于领域本体的Web语义信息检索研究,TP391.3
  20. 基于关系数据库本体构建工具的研究与设计,TP311.13

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com