学位论文 > 优秀研究生学位论文题录展示

完备/不完备信息系统的若干知识约简算法的研究

作　者: 王秀
导　师: 叶东毅
学　校: 福州大学
专　业: 计算机应用
关键词: 粗糙集完备信息系统分布约简不完备信息系统限制相容关系增量聚类
分类号: TP182
类　型: 硕士论文
年　份: 2005年
下　载: 150次
引　用: 0次
阅　读: 论文下载

内容摘要

随着数据库技术的迅猛发展和广泛应用，人们可以轻易获得海量的数据，这些数据每天都在增长中，数据挖掘是发现这些数据背后隐藏的知识的有效手段，但是，如果在数据库更新之后都要对全部数据进行重新挖掘，需要消耗大量的资源，这就导致了对增量挖掘算法的研究。除此之外，由于各种各样的原因，数据表中数据错误或数据缺失的现象常常出现，这就使得表中某些对象的某些实际值未知，导致了待处理数据有某种程度的不完整。如何对不完备的信息系统进行属性约简，也是研究的一个新方向。　粗糙集理论自1982年由Pawlak 首次提出以来，经过20年的研究和发展，已经在理论和应用上取得了丰硕的成果。该理论不依赖于数据集之外的任何先验知识信息，对不精确、不确定、不完整的信息和知识具有很强的分析能力。对粗糙集理论作深入的研究，将有利于更加有效地从海量数据中提取出有价值且可理解性强的知识，也有利于数据挖掘在商业中的进一步普及和应用。　论文主要针对粗糙集理论在完备信息系统及不完备信息系统中的一些应用做一些的研究，所做的主要工作有：1.在完备信息系统下，对一些常见的属性约简算法进行研究分析，根据已有的分布约简的概念，提出了一种基于分布约简的获取规则的增量式算法。把增量算法与数据库的更新结合在一起，渐增地进行知识的更新，修正和加强先前业已发现的知识，这样可以不必重新挖掘全部数据。2.在不完备信息系统下，研究分析粗糙集的扩展模型，在此基础上对已存在的不完备信息系统的粗糙集分层递阶约简方法进行改进，得到了不完备信息系统的规则约简算法。3.结合以上的工作，在分布约简及粗糙集扩展模型——限制相容关系的基础上提出了一种不完备信息系统属性约简的增量式方法。4.研究分析数据的预处理技术，提出了一个可预测的自动聚类算法，将连续的数据离散化。

全文目录

第一章绪论  7-14
  1.1 引言  7
  1.2 知识发现和数据挖掘的研究和发展现状  7-9
  1.3 粗糙集的发展和研究状况  9-11
    1.3.1 粗糙集的发展概况  9-10
    1.3.2 粗糙集的应用和研究现状  10-11
    1.3.3 粗糙集理论的优点  11
  1.4 论文主要内容及创新点  11-12
  1.5 论文组织结构  12-14
第二章粗糙集理论  14-25
  2.1 粗糙集理论基础  14-18
    2.1.1 知识和分类  14-15
    2.1.2 决策表和不可分辨关系  15-16
    2.1.3 粗糙集合的下近似、上近似、边界区和粗糙隶属函数  16-18
    2.1.4 知识的约简与核  18
  2.2 信息系统的确定性和不确定性  18-19
  2.3 信息系统的完备性和不完备性  19
  2.4 完备信息系统下粗糙集的约简算法  19-25
    2.4.1 一般约简算法  20
    2.4.2 基于可辨识矩阵和逻辑运算的属性约简算法  20-23
    2.4.3 基于属性重要性的属性约简算法  23-24
    2.4.4 基于二进制可辨矩阵的属性约简启发式算法  24-25
第三章基于分布约简的获取规则的增量式算法  25-31
  3.1 基本概念  25-27
  3.2 增量式算法的描述  27-28
  3.3 实例分析  28-31
第四章不完备信息系统下粗糙集的扩展模型  31-36
  4.1 相容关系  32
  4.2 非对称的相似关系  32-33
  4.3 量化的容差关系  33-34
  4.4 限制的相容关系  34-35
  4.5 各种模型的分析和比较  35-36
第五章不完备信息系统的规则约简算法  36-42
  5.1 基本概念  36-37
  5.2 分层递阶约简算法分析  37
  5.3 算法的改进  37-39
  5.4 实例分析  39-42
第六章不完备信息系统属性约简的增量式方法  42-48
  6.1 基本概念  42
  6.2 增量式属性约简的方法  42-45
  6.3 实例分析  45-48
第七章一个可预测的自动聚类算法  48-59
  7 1 聚类的基本概念  48-50
    7.1.1 聚类的定义  48-49
    7.1.2 聚类的要求  49-50
  7.2 聚类的常用算法  50-51
  7.3 一个可预测的自动聚类算法  51-58
    7.3.1 原算法思想及聚类过程  51-53
    7.3.2 几个改进点  53-55
    7.3.3 算法描述  55
    7.3.4 与K－平均算法的比较  55-58
  7.4 结论  58-59
总结与展望  59-60
参考文献  60-63
致谢  63-64
个人简历  64
发表论文  64

完备/不完备信息系统的若干知识约简算法的研究

内容摘要

全文目录

相似论文