学位论文 > 优秀研究生学位论文题录展示

基于粗糙集理论的不完备信息系统数据挖掘的研究

作 者: 徐磊
导 师: 舒兰
学 校: 电子科技大学
专 业: 运筹学与控制论
关键词: 粗糙集 数据挖掘 属性约简 模糊集 排序
分类号: TP18
类 型: 硕士论文
年 份: 2013年
下 载: 22次
引 用: 0次
阅 读: 论文下载
 

内容摘要


作为一种处理模糊和不确定性问题的数据分析工具,粗糙集理论是非常具有优势的。它能有效的处理不完备的、不精确的、不确定的那些问题,现在已经和数据挖掘、模式识别成功的结合起来。知识发现(KD)或者数据挖掘(DM)就是从那些海量的、缺失的、不确定性的、模糊的、有噪声的、随机的数据集合中甄别隐藏在信息系统中的人类喜好关注的或者说有用的知识。在基于粗糙集的数据挖掘的研究中数据处理是整个数据挖掘的关键,在数据处理中我们要对条件属性集合进行约简和对数据进行离散化处理,而属性约简正是粗糙集的核心内容之一,所以用粗糙集的知识研究数据挖掘是不错的选择。模糊理论这种工具已经被用来处理模糊现象(所表现出来的现象是模糊不清的)和模糊概念(是指所定义的概念它的外延具有不确定性,也就是说它的外延是模糊不清的),模糊数学处理的事件在本质上也是不确定的,是模糊存在的,模糊数学和粗糙集有很强的共通性和互补性,如何依赖这些特性,是研究粗糙集模型和模糊模型顺利结合的关键。本文主要论述粗糙集知识和排序知识、模糊知识、SVM知识相结合的问题,主要研究内容如下:(1)研究了对0,1决策信息系统排序后的基于辨识矩阵和属性重要度的启发式约简算法的算法时间复杂度,然后与经典粗糙集约简算法进行比较研究。对完备信息系统排序后的基于辨识矩阵约简和属性重要度的启发式约简的算法算法时间复杂度和经典粗糙集约简算法进行比较研究。再对不完备信息系统排序后的约简算法进行了粗略探讨。(2)讨论了基于模糊集和粗糙集相结合的模型,建立了关于模糊隶属函数的基于联系度模糊容差关系模型,讨论了这个模型的约简问题,在文中用模糊集合的模糊特征评价来代替粗糙集属性重要度进行属性约简,并且用模糊关系矩阵的知识论证了粗糙集属性约简中辨识矩阵降维方法的可行性。(3)在文章末尾粗略的研究了粗糙SVM模型。

全文目录


摘要  5-6
ABSTRACT  6-10
第一章 绪论  10-16
  1.1 数据挖掘的概念  10-12
  1.2 粗糙集理论的发展和现状研究  12-13
  1.3 模式识别和 SVM 的概念  13-15
  1.4 本文研究内容与组织结构  15-16
第二章 基础知识  16-24
  2.1 粗糙集的基础知识  16-17
  2.2 集合的上下近似  17
  2.3 属性重要性的度量方法  17-18
  2.4 信息系统的知识的约简与核属性  18
  2.5 信息系统的一些约简方法  18-19
  2.6 模糊集基本知识  19-20
  2.7 模糊粗糙集  20-21
  2.8 SVM 基本知识  21-24
第三章 几种信息系统排序后的分类和属性约简算法研究  24-35
  3.1 0,1 信息系统的排序约简  24-29
    3.1.1 基于辨识矩阵的 0,1 信息系统约简  26-28
    3.1.2 基于 0,1 信息系统属性重要度约简算法  28-29
  3.2 对一般的完备信息系统的排序约简  29-32
  3.3 不完备信息系统的排序约简  32-34
  3.4 本章小结  34-35
第四章 基于模糊集的粗糙集属性约简方法  35-46
  4.1 基于α联系度的模糊容差关系  35-39
  4.2 模糊特征评价研究新模型的属性约简方法  39-42
  4.3 基于模糊关系矩阵的辨识矩阵降维约简  42-44
  4.4 粗糙集约简和模糊关系矩阵约简的关系  44-45
  4.5 本章小结  45-46
第五章 粗糙 SVM 模型的粗略研究  46-50
  5.1 粗糙 SVM 模型  46-49
  5.2 本章小结  49-50
结论与展望  50-52
致谢  52-53
参考文献  53-56
攻读硕士学位期间发表论文  56-57

相似论文

  1. 基于支持向量机的故障诊断方法研究,TP18
  2. 基于数据挖掘技术的保健品营销研究,F426.72
  3. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  4. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  5. 基于连锁图的QTL综合分析方法研究,S562
  6. Bicluster数据分析软件设计与实现,TP311.52
  7. 基于变异粒子群的聚类算法研究,TP18
  8. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  9. 基于遗传算法和粗糙集的聚类算法研究,TP18
  10. 基于粗糙集的城市区域交通绿时控制系统研究,TP18
  11. 太原市草坪杂草群落生态与科学管理研究,S451
  12. 中条山麻栎群落数量生态研究,Q948
  13. 煤矿开采区植被退化定量监测与评价,Q948
  14. 山西果园杂草数量生态与管理策略研究,S451
  15. 太原东山油松人工林数量特征与生物多样性研究,S791.254
  16. 旅游对芦芽山国家级自然保护区典型植被的影响,S759.9
  17. 基于数据挖掘的税务稽查选案研究,F812.42
  18. 网络搜索引擎的相关技术研究,G354
  19. 面向社区教育的个性化学习系统的研究与实现,TP391.6
  20. 基于Fuzzy的煤矿企业生产指标多目标决策研究,F426.21
  21. 基于DFS的概念学习机制研究,TP181

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com