学位论文 > 优秀研究生学位论文题录展示

基于粗糙集的数据挖掘算法研究与应用

作 者: 张国荣
导 师: 王治和
学 校: 西北师范大学
专 业: 计算机应用技术
关键词: 数据挖掘 粗糙集 知识约简 决策树
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 51次
引 用: 0次
阅 读: 论文下载
 

内容摘要


作为知识发现中的核心环节,数据挖掘能够从海量数据中提取有价值的信息,是当前人工智能和信息科学研究领域中的热点课题。基于粗糙集的数据挖掘,就是利用粗糙集理论及方法从数据中挖掘出新颖的、有用的知识的过程。决策树是数据挖掘中最常用的方法,具有速度快、结构简单、易理解等优点。然而在实际应用过程中,现存的决策树算法有着许多不足之处,本文将粗糙集与决策树相结合,对优化决策树算法进行了深入分析和研究。1、粗糙集部分。分析讨论了差别矩阵约简算法,并提出了简化差别矩阵约简方法。该方法用等价类构造差别矩阵,与单个元素参与差别矩阵构造相比更易得到决策表的约简;由于属性的知识量越大,说明它的区分力越强,提出了一种基于属性区分力的决策表知识约简方法。该方法将差别矩阵与属性区分力相结合,与基于正区域等方法相比,它更容易搜索到属性约简。2、决策树部分。结合粗糙集,提出了基于区分价值的决策树优化算法。该方法根据属性区分价值的不同,把属性分成两部分,能够较快地得到区分价值较高的候选属性;从知识约简和剪枝两方面对决策树算法进行优化,提出了一种基于粗糙集的决策树后剪枝优化算法。该方法首先利用基于属性区分力的约简方法计算出重要结点,且在剪枝过程中不必计算非重要结点的错误率,从而降低了决策树算法复杂度,提高了建树的效率。3、最后,对本文提出的基于区分价值的优化算法和基于粗糙集的决策树后剪枝优化算法分别与相关算法进行了实验评估与对比。实验结果表明这两种算法都具有可行性,取得了较好的效果。

全文目录


摘要  4-5
Abstract  5-9
第一章 绪论  9-14
  1.1 研究的目的与意义  9-10
  1.2 国内外研究历史与现状  10-13
    1.2.1 粗糙集的研究历史与现状  10-11
    1.2.2 决策树研究历史与现状  11-13
  1.3 本文的研究工作  13
  1.4 本文的组织  13-14
第二章 相关理论概述  14-31
  2.1 粗糙集基本理论  14-22
    2.1.1 粗糙集中的知识表达系统  14-16
    2.1.2 不可区分关系与上、下近似  16-17
    2.1.3 决策表知识约简  17-18
    2.1.4 决策约简规则  18-19
    2.1.5 基于差别矩阵的知识约简  19-22
  2.2 决策树简介  22-30
    2.2.1 决策树构造的基本流程  22-23
    2.2.2 几种常用决策树算法  23-26
    2.2.3 决策树后剪枝方法及比较  26-29
    2.2.4 ID3 算法实例  29-30
  2.3 本章小结  30-31
第三章 基于粗糙集的算法改进  31-41
  3.1 知识约简算法改进  31-37
    3.1.1 问题的提出  31-32
    3.1.2 属性区分力的知识约简计算方法  32-34
    3.1.3 决策表属性区分力的知识约简算法  34-35
    3.1.4 算法实例  35-37
  3.2 基于粗糙集的决策树改进算法  37-40
    3.2.1 基于区分价值的决策树优化算法  37-39
    3.2.2 基于粗糙集的决策树后剪枝优化算法  39-40
  3.3 本章小结  40-41
第四章 实验结果与分析  41-46
  4.1 算法3.2 与相关算法比较  41-42
  4.2 算法3.3 与REP算法比较  42-45
    4.2.1 实例分析  42-44
    4.2.2 实验结果与分析  44-45
  4.3 本章小结  45-46
第五章 总结与展望  46-48
  5.1 主要工作总结  46
  5.2 未来的研究工作  46-48
参考文献  48-53
致谢  53-54
攻读学位期间发表的论文  54
攻读硕士期间参与科研项目  54

相似论文

  1. 基于支持向量机的故障诊断方法研究,TP18
  2. 基于数据挖掘技术的保健品营销研究,F426.72
  3. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  4. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  5. 基于连锁图的QTL综合分析方法研究,S562
  6. Bicluster数据分析软件设计与实现,TP311.52
  7. 基于变异粒子群的聚类算法研究,TP18
  8. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  9. 基于遗传算法和粗糙集的聚类算法研究,TP18
  10. 基于粗糙集的城市区域交通绿时控制系统研究,TP18
  11. 基于数据挖掘的税务稽查选案研究,F812.42
  12. 面向社区教育的个性化学习系统的研究与实现,TP391.6
  13. 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
  14. 数据仓库技术在银行客户管理系统中的研究和实现,TP315
  15. 基于Moodle的高职网络教学系统设计与实现,TP311.52
  16. 教学质量评估数据挖掘系统设计与开发,TP311.13
  17. 粗糙集的增量式属性约简研究,TP18
  18. 知识粒度的计算及其在属性约简中的应用研究,TP18
  19. 关联规则算法在高职院校贫困生认定工作中的应用,G717
  20. 基于数据挖掘技术在城市供水的分析与决策,F299.24;F224
  21. 数据挖掘技术在电视用户满意度分析中的应用研究,TP311.13

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com