学位论文 > 优秀研究生学位论文题录展示
粗糙集属性约简算法设计与实现
作 者: 姜玉苹
导 师: 祝峰
学 校: 电子科技大学
专 业: 计算机软件与理论
关键词: 数据挖掘 粗糙集 属性约简 分类树
分类号: TP18
类 型: 硕士论文
年 份: 2011年
下 载: 168次
引 用: 0次
阅 读: 论文下载
内容摘要
数据挖掘是一门从大量的数据中挖掘出隐藏的有潜在价值知识的技术,是当今研究的热点内容之一。数据挖掘的技术有:决策树方法、模糊集方法、遗传算法、神经网络方法、粗糙集方法、数据统计方法等,其中粗糙集方法起到了非常重要的作用。粗糙集理论自1982年被提出以来,得到了许多研究者们的重视,近年来,其理论和应用方面都取得了极大的进展,在数据挖掘、智能分析以及机器学习等领域都用到了粗糙集理论及其算法。在数据挖掘领域主要是用到了粗糙集的属性约简算法,通过属性约简算法来缩减数据库中的数据量,从而能够使知识发现的时间更短,知识发现结果的质量更高。本论文针对属性约简算法做了如下几个方面的工作:(1)学习了数据挖掘和粗糙集的背景知识以及现存的一些典型的属性约简算法。现存的典型的属性约简算法有基于差别矩阵的属性约简算法、基于属性重要度和信息熵的属性约简算法、基于遗传算法的属性约简算法、基于动态规划的属性约简方法等。(2)提出了基于分类树的属性约简方法。该方法充分利用了树的结构特征来表示属性的分类能力,每个叶子节点代表的是对象集,叶子节点的个数代表了树的对应信息系统的分类情况。每个中间节点都代表了一个属性,中间节点的不同分支代表了不同的属性值。如果删除一个属性对应的列后,用信息系统中剩余的属性及值建立起来的分类树的叶子节点的个数不比删除之前少,则说明该属性是冗余的,在属性约简的过程中可以被删除。否则说明该属性是必要的,不能被约简掉的。(3)在基于分类树的基础上提出了最小属性约简算法。因为一般来说,属性的个数越少,挖掘出的规律也更具有代表性。所以研究最小的属性约简也是许多研究者们关注的主要问题之一。本文就是在基于分类树的基础上,用了分支界限法的思想,通过用尽可能少的组合次数来求出最小的属性约简。
|
全文目录
摘要 4-5 ABSTRACT 5-9 第一章 绪论 9-16 1.1 数据挖掘发展概述 9-12 1.2 粗糙集理论的发展史 12-13 1.3 基于粗糙集的属性约简 13-14 1.4 本论文的研究内容与组织结构 14-16 第二章 粗糙集理论 16-28 2.1 集合论相关知识简介 17-18 2.2 知识与知识库 18-20 2.3 知识表达系统和决策表 20 2.4 近似空间 20-22 2.5 核与约简 22-23 2.6 差别矩阵和差别函数 23-25 2.7 属性重要度 25-26 2.8 信息熵 26-27 2.9 本章总结 27-28 第三章 信息系统的属性约简算法 28-41 3.1 盲目删除属性约简算法 28-29 3.1.1 算法基本思想 28-29 3.1.2 算法的优缺点 29 3.2 基于属性重要度的属性约简算法 29-31 3.2.1 算法基本思想 29-30 3.2.2 算法的优缺点 30-31 3.3 基于差别矩阵的属性约简算法 31-35 3.3.1 基于差别矩阵的信息系统的属性约简算法 32 3.3.2 基于差别函数的信息系统的属性约简算法 32-33 3.3.3 改进的基于差别函数的属性约简算法 33-34 3.3.4 基于差别矩阵和属性选择的属性约简算法 34 3.3.5 算法的优缺点 34-35 3.4 基于信息熵的属性约简算法 35-37 3.5 基于遗传算法的属性约简算法 37-39 3.6 基于扩展规则的属性约简算法 39 3.7 基于动态约简的属性约简算法 39-40 3.8 本章总结 40-41 第四章 基于树的属性约简算法 41-55 4.1 基本概念 41-44 4.1.1 二维表和分类树 41-43 4.1.2 基于分类树的定理 43-44 4.2 基于分类树的属性约简算法 44 4.3 基于分类树属性约简算法实例分析 44-49 4.4 算法实现 49-53 4.4.1 算法的输入输出 49 4.4.2 算法的主要数据结构 49-50 4.4.3 算法的主要接口函数 50-53 4.5 算法复杂度分析 53-54 4.6 本章总结 54-55 第五章 基于树的最小属性约简算法 55-65 5.1 最小属性约简算法的思路 55-56 5.2 求最小属性约简算法的改进 56-57 5.3 算法的实例分析 57-62 5.4 算法的复杂度分析 62-63 5.5 属性约简算法的比较 63-64 5.6 本章总结 64-65 第六章 总结与展望 65-67 6.1 全文总结 65-66 6.2 课题的后续研究工作 66-67 致谢 67-68 参考文献 68-71 攻硕期间取得的研究成果 71-72
|
相似论文
- 基于支持向量机的故障诊断方法研究,TP18
- 基于数据挖掘技术的保健品营销研究,F426.72
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
- 基于连锁图的QTL综合分析方法研究,S562
- Bicluster数据分析软件设计与实现,TP311.52
- 基于变异粒子群的聚类算法研究,TP18
- 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- 基于粗糙集的城市区域交通绿时控制系统研究,TP18
- 基于数据挖掘的税务稽查选案研究,F812.42
- 面向社区教育的个性化学习系统的研究与实现,TP391.6
- 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
- 数据仓库技术在银行客户管理系统中的研究和实现,TP315
- 基于Moodle的高职网络教学系统设计与实现,TP311.52
- 教学质量评估数据挖掘系统设计与开发,TP311.13
- 粗糙集的增量式属性约简研究,TP18
- 知识粒度的计算及其在属性约简中的应用研究,TP18
- 关联规则算法在高职院校贫困生认定工作中的应用,G717
- 基于数据挖掘技术在城市供水的分析与决策,F299.24;F224
- 数据挖掘技术在电视用户满意度分析中的应用研究,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com
|