学位论文 > 优秀研究生学位论文题录展示
数据预处理中粗糙集理论的应用研究
作 者: 刘斌
导 师: 倪志伟
学 校: 合肥工业大学
专 业: 工程与项目管理
关键词: 粗糙集 属性重要性 属性约简 数据预处理
分类号: TP18
类 型: 硕士论文
年 份: 2010年
下 载: 104次
引 用: 0次
阅 读: 论文下载
内容摘要
机器学习中很多方法要求属性是离散的,特别是粗糙集方法只能处理离散的属性,而实际中很多属性是连续值的。因此有必要对连续属性进行离散化。针对改进的贪心算法在信息表中判断断点存在的缺陷,通过引入属性重要性的概念,在无法选择断点时,通过计算属性的重要性大小,优先选择属性重要的断点。本文在查阅国内外文献的基础上,对粗糙集理论及其面向连续属性离散化的基础理论和基本方法进行了深入的理论研究和实验分析,主要内容如下:介绍了粗糙集理论的一般流程和基本理论、方法,并深入研究连续属性离散化的贪心算法的基本理论和方法,对经典的方法进行了全面的分析和比较,指出其应用范围、不足之处,并在此基础之上提出了改进的算法。同时对粗糙集理论中属性约简的算法进行分析研究,指出一般属性约简算法的不足,并且对一般属性约简算法做出了适合数据量大的改进。提出了对贪心算法的改进策略,在具体问题中结合相应的特点再作相应的改进,通过具体算例的验证,表明算法是可行的。介绍了贪心算法的基本概念和实现步骤,探讨了多种采用贪心算法的实现方法并比较了其优缺点,表明了贪心算法用来连续属性离散化的有效性。
|
全文目录
相似论文
- 基于支持向量机的故障诊断方法研究,TP18
- 基于连锁图的QTL综合分析方法研究,S562
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- 基于粗糙集的城市区域交通绿时控制系统研究,TP18
- 粗糙集的增量式属性约简研究,TP18
- 知识粒度的计算及其在属性约简中的应用研究,TP18
- 基于粗糙集和模糊SVM的车牌识别技术研究,TP391.41
- 动力灾害煤炭资源开采危险程度预测方法,TD713
- 基于粗糙集理论的文本分类研究,TP18
- 基于支持向量机(SVM)理论的个人信用评估研究,TP18
- 数据挖掘技术在环境保护综合管理系统中的应用,TP311.13
- 基于高斯过程的在线建模问题研究,TP181
- 基于Web数据挖掘的网页优化设计应用研究,TP393.092
- 基于投影寻踪回归的网络异常检测机制研究,TP393.08
- 基于数据挖掘聚类技术的我国高校分类研究,TP311.13
- 惯性运动捕捉系统中传感数据的传输与处理,TP212
- 基于粗集理论的大曲理化指标重要性研究,TS262.3
- “嫦娥一号”微波探测仪数据预处理与分析,V446.9
- 基于FPGA的极紫外相机主控系统设计,V445.8
- 特征增强的体数据量化算法和传输函数设计,TP391.41
- 电子地图自动注记系统的设计与实现,P208
中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com
|