学位论文 > 优秀研究生学位论文题录展示
基于敏感度的可抗噪的模糊SLIQ决策树
作 者: 张海堂
导 师: 邱洪泽
学 校: 山东大学
专 业: 计算机软件与理论
关键词: 决策树 模糊集合理论 敏感度 SLIQ 箱线图
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 27次
引 用: 0次
阅 读: 论文下载
内容摘要
决策树作为数据挖掘领域最为广泛使用的技术之,由于其在知识获取以及知识表达方面的突出优势而备受青睐。伴随着海量数据的产生,数据中蕴含的不确定知识同时日益增长,因此人们对这些不确定知识给予了越来越多的关注。上世纪60年代中期,扎德建设性地提出了模糊集合理论,从此人们对模糊知识有了更为精确的表达。同时,众多的学者把模糊集合理论引入了决策树领域,以克服传统决策树存在的尖锐边界问题。ID3算法较早地被模糊化,而最近,SLIQ算法也被引入了模糊环境。本文针对Chandra等人提出的模糊SLIQ算法—G-FDT算法进行讨论,对由该算法归纳出的模糊决策树退化为传统的清晰决策树这一现象,剖析出其中的原因。并根据传统的分裂测试评估函数在模糊环境下表现出的凸性弊端,本文提出了一种新的模糊SLIQ算法——可抗噪的基于属性敏感度的模糊决策树归纳算法,相比于G-FDT,该算法的主要改进有:(1)针对G-FDT算法构造出的候选属性对应得区分函数的形状过于狭窄的问题,本文提出的确定区分函数形状的方法从根本上避免了区分函数近似于清晰区分函数。(2)提出了候选属性敏感度的概念。根据传统节点分裂测试的启发式评估函数在模糊环境下存在的凸性弊端,本文提出了显示候选属性的分类能力的分类敏感度的概念,对于分类敏感度高的候选属性使其对应的区分函数形状性对狭窄,从而使得这种属性倾向于被选择。(3)提出了对训练数据进行异常探测机制。由于G-FDT或早期提出的SG-FDT算法抗干扰能力极差,由其构造出的决策树结构对具体的训练样本较为敏感,削弱了决策树对知识的良好的表达能力。为此,改进后的算法中,当节点进行分裂测试时,对当前的数据进行排噪处理。从而获得决策树相对更加稳定、健壮。(4)提出了使得计算效率提高的优化措施。为了使改进后的归纳算法更加具有实用性,本文提出了多种优化措施来减少由较为复杂的操作而带来的巨大开销,这些措施包括增加节点分裂终止标准、对候选属性进行测试前进行检测以便确定该属性是否被当前节点的祖先节点使用过。本文对可抗噪的基于敏感度的模糊决策树归纳算法进行了相应的实验模拟和结果分析,实验结果表明,该算法真正实现了模糊SLIQ算法,表现出了良好的健壮性,并且有该算法构造出的模糊决策树的分类能力、计算效率方面有了较大的提高。
|
全文目录
摘要 8-10 ABSTRACT 10-12 第1章 绪论 12-16 1.1 研究背景及意义 12-13 1.2 国内外研究现状 13-14 1.3 本文主要工作 14-15 1.4 本文组织结构 15-16 第2章 模糊决策树 16-33 2.1 经典决策树 16-25 2.1.1 分类问题 16-17 2.1.2 经典决策树定义 17-18 2.1.3 决策树归纳算法概述 18-21 2.1.4 决策树修剪与评估 21-22 2.1.5 可伸缩的决策树技术 22-25 2.2 模糊集合理论 25-30 2.2.1 经典集合理论 26 2.2.2 隶属函数与模糊集合 26-28 2.2.3 模糊集上的一般运算 28-30 2.3 模糊决策树 30-33 第3章 模糊SLIQ决策树归纳算法 33-48 3.1 模糊SLIQ算法概述 33 3.2 G-FDT算法概述 33-41 3.2.1 候选属性模糊化 34-36 3.2.2 节点分裂 36-38 3.2.3 G-FDT节点分裂终止准则 38 3.2.4 G-FDT算法描述 38-41 3.3 G-FDT算法的缺陷 41-46 3.3.1 缺陷分析 41-44 3.3.2 G-FDT缺陷诱因分析 44-46 3.4 修正G-FDT算法的原则 46-47 3.5 本章小结 47-48 第4章 基于分类敏感度的抗噪模糊SLIQ决策树算法 48-61 4.1 基于敏感度的模糊SLIQ决策树算法SG-FDT 48-53 4.1.1 候选属性的分类敏感度 49-52 4.1.2 SG-FDT模糊决策树归纳算法 52-53 4.2 可抗噪的SG-FDT算法 53-60 4.2.1 箱线图异常点探测机制 53-57 4.2.2 SG-FDT计算效率改进 57-58 4.2.3 可抗噪SG-FDT算法概述 58-60 4.3 本章小结 60-61 第5章 实验分析 61-66 5.1 训练数据及决策树验证 61-62 5.2 分类精度对比分析 62-63 5.3 决策树规模与构造开销的对比分析 63-64 5.4 决策树结构分析 64-65 5.5 本章小结 65-66 第6章 总结和展望 66-68 6.1 总结 66-67 6.2 展望 67-68 参考文献 68-72 致谢 72-73 攻读硕士期间发表的学术论文目录 73-74 学位论文评阅及答辩情况表 74
|
相似论文
- 基于支持向量机的故障诊断方法研究,TP18
- 教学质量评估数据挖掘系统设计与开发,TP311.13
- 公允价值应用与上市公司投资行为异化关系的实证研究,F832.51;F224
- 基于HVS的无参考图像质量评价方法的研究,TP391.41
- 英语专业大学生跨文化交际能力情感层面研究,H319
- 一种应用频响敏感度的MOS管尺寸自动优化方法,TN722.77
- 基于学生评教数据挖掘与教学质量分析系统的研究,TP311.13
- 基于粗糙集理论的决策树分类算法与应用研究,TP18
- 基于核心示例集的属性约简方法研究,O159
- 基于广义信息熵的决策树模型及其在绩效评价中的应用,TP18
- 基于改进的ID3算法的蛋白质纯化方法研究,Q51
- 五种决策树算法的比较研究,TP311.13
- 信用卡风险管理技术及利润预测模型,F224
- 服务器电磁兼容性设计与试验,TN03
- 汉语语音合成系统的改进与实现,TN912.33
- 基于视觉特性的高速公路景观要素设计研究,U418.9
- 弱视患儿治疗前后的对比敏感度的比较,R777.44
- 斜视性和屈光参差性弱视患者视觉缺损模式的研究,R777.44
- 中西医结合治疗前部缺血性视神经病变的临床研究,R774.6
- 中国15岁以上人群乙型肝炎免疫预防的决策分析模型研究,R392.1
- 广州市乙肝相关疾病经济负担及1~14岁人群乙肝疫苗接种策略研究,R186
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|