学位论文 > 优秀研究生学位论文题录展示

完备/不完备信息系统的若干知识约简算法的研究

作 者: 王秀
导 师: 叶东毅
学 校: 福州大学
专 业: 计算机应用
关键词: 粗糙集 完备信息系统 分布约简 不完备信息系统 限制相容关系 增量 聚类
分类号: TP182
类 型: 硕士论文
年 份: 2005年
下 载: 150次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着数据库技术的迅猛发展和广泛应用,人们可以轻易获得海量的数据,这些数据每天都在增长中,数据挖掘是发现这些数据背后隐藏的知识的有效手段,但是,如果在数据库更新之后都要对全部数据进行重新挖掘,需要消耗大量的资源,这就导致了对增量挖掘算法的研究。除此之外,由于各种各样的原因,数据表中数据错误或数据缺失的现象常常出现,这就使得表中某些对象的某些实际值未知,导致了待处理数据有某种程度的不完整。如何对不完备的信息系统进行属性约简,也是研究的一个新方向。 粗糙集理论自1982年由Pawlak 首次提出以来,经过20年的研究和发展,已经在理论和应用上取得了丰硕的成果。该理论不依赖于数据集之外的任何先验知识信息,对不精确、不确定、不完整的信息和知识具有很强的分析能力。对粗糙集理论作深入的研究,将有利于更加有效地从海量数据中提取出有价值且可理解性强的知识,也有利于数据挖掘在商业中的进一步普及和应用。  论文主要针对粗糙集理论在完备信息系统不完备信息系统中的一些应用做一些的研究,所做的主要工作有:1.在完备信息系统下,对一些常见的属性约简算法进行研究分析,根据已有的分布约简的概念,提出了一种基于分布约简的获取规则的增量式算法。把增量算法与数据库的更新结合在一起,渐增地进行知识的更新,修正和加强先前业已发现的知识,这样可以不必重新挖掘全部数据。2.在不完备信息系统下,研究分析粗糙集的扩展模型,在此基础上对已存在的不完备信息系统的粗糙集分层递阶约简方法进行改进,得到了不完备信息系统的规则约简算法。3.结合以上的工作,在分布约简及粗糙集扩展模型——限制相容关系的基础上提出了一种不完备信息系统属性约简的增量式方法。4.研究分析数据的预处理技术,提出了一个可预测的自动聚类算法,将连续的数据离散化。

全文目录


第一章 绪论  7-14
  1.1 引言  7
  1.2 知识发现和数据挖掘的研究和发展现状  7-9
  1.3 粗糙集的发展和研究状况  9-11
    1.3.1 粗糙集的发展概况  9-10
    1.3.2 粗糙集的应用和研究现状  10-11
    1.3.3 粗糙集理论的优点  11
  1.4 论文主要内容及创新点  11-12
  1.5 论文组织结构  12-14
第二章 粗糙集理论  14-25
  2.1 粗糙集理论基础  14-18
    2.1.1 知识和分类  14-15
    2.1.2 决策表和不可分辨关系  15-16
    2.1.3 粗糙集合的下近似、上近似、边界区和粗糙隶属函数  16-18
    2.1.4 知识的约简与核  18
  2.2 信息系统的确定性和不确定性  18-19
  2.3 信息系统的完备性和不完备性  19
  2.4 完备信息系统下粗糙集的约简算法  19-25
    2.4.1 一般约简算法  20
    2.4.2 基于可辨识矩阵和逻辑运算的属性约简算法  20-23
    2.4.3 基于属性重要性的属性约简算法  23-24
    2.4.4 基于二进制可辨矩阵的属性约简启发式算法  24-25
第三章 基于分布约简的获取规则的增量式算法  25-31
  3.1 基本概念  25-27
  3.2 增量式算法的描述  27-28
  3.3 实例分析  28-31
第四章 不完备信息系统下粗糙集的扩展模型  31-36
  4.1 相容关系  32
  4.2 非对称的相似关系  32-33
  4.3 量化的容差关系  33-34
  4.4 限制的相容关系  34-35
  4.5 各种模型的分析和比较  35-36
第五章 不完备信息系统的规则约简算法  36-42
  5.1 基本概念  36-37
  5.2 分层递阶约简算法分析  37
  5.3 算法的改进  37-39
  5.4 实例分析  39-42
第六章 不完备信息系统属性约简的增量式方法  42-48
  6.1 基本概念  42
  6.2 增量式属性约简的方法  42-45
  6.3 实例分析  45-48
第七章 一个可预测的自动聚类算法  48-59
  7 1 聚类的基本概念  48-50
    7.1.1 聚类的定义  48-49
    7.1.2 聚类的要求  49-50
  7.2 聚类的常用算法  50-51
  7.3 一个可预测的自动聚类算法  51-58
    7.3.1 原算法思想及聚类过程  51-53
    7.3.2 几个改进点  53-55
    7.3.3 算法描述  55
    7.3.4 与K-平均算法的比较  55-58
  7.4 结论  58-59
总结与展望  59-60
参考文献  60-63
致谢  63-64
个人简历  64
发表论文  64

相似论文

  1. 隐式用户兴趣挖掘的研究与实现,TP311.13
  2. 图像分割中阴影去除算法的研究,TP391.41
  3. 基于图分割的文本提取方法研究,TP391.41
  4. 基于支持向量机的故障诊断方法研究,TP18
  5. 牡丹EST-SSR引物开发及其亲缘关系分析,S685.11
  6. 高血压前期证候特征研究,R259
  7. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  8. 社会主义和谐社会视阈下的增量民主研究,D621
  9. K-均值聚类算法的研究与改进,TP311.13
  10. 大学生综合素质测评研究,G645.5
  11. 大豆品种对腐竹品质的影响及其品质评价体系的初步构建,TS214.2
  12. 21个荷花品种遗传多样性的ISSR分析,S682.32
  13. 基于聚类分析的P2P流量识别算法的研究,TP393.02
  14. 基于混合自适应遗传算法的动态网格调度问题研究,TP393.09
  15. 桃杂交后代(F1)幼苗光合效能评价,S662.1
  16. 全球化背景下当代中国发展道路研究,D616
  17. 南通市农业面源污染负荷研究与综合评价,X592
  18. 土壤环境功能区划研究,X321
  19. 基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建,S435.651
  20. 大豆杂种优势及其遗传基础研究,S565.1
  21. 象草自交后代无性系的饲用价值及生物质能特性初步评价,S543.9

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论 > 专家系统、知识工程
© 2012 www.xueweilunwen.com