学位论文 > 优秀研究生学位论文题录展示
基于粗糙集理论的数据挖掘技术及其在私家车潜在消费群体研究中的应用
作 者: 张博
导 师: 刘文奇
学 校: 昆明理工大学
专 业: 系统分析与集成
关键词: 粗糙集 属性约简 属性值约简 数据挖掘 汽车消费
分类号: TP311.13
类 型: 硕士论文
年 份: 2012年
下 载: 29次
引 用: 0次
阅 读: 论文下载
内容摘要
随着数据库技术的逐渐成熟,数据库应用的迅速普及,以及互联网的飞速发展,人类所积累的数据量正以指数级的速度增长。基于数据库的知识发现是最近几年发展起来的一门新兴技术,它处理数据库中大量的数据,挖掘出更深层次的知识、更具决策力的信息。数据挖掘是从大量的、不完全的、有噪声的、随机的、模糊的数据中,提取出隐含在其中的、人们事先不知道的、有价值的知识。其中数据预处理是整个数据挖掘的关键步骤,是数据挖掘工作进行之前的必备工作,在这个阶段之后再进行属性的约简和数据的规范化处理。粗糙集理论是上世纪八十年代初由波兰数学家Pawlak首先提出的,它是一种处理模糊和不确定性知识的数学工具。其中属性约简是粗糙集理论的核心内容,属性约简是保持分类能力不变的前提下,删除冗余的属性。传统的属性约简算法是基于主存的算法。基于关系数据库操作的属性约简算法利用关系数据库本身的操作算子和SQL操作,能够比传统算法更加高效地进行数据挖掘。在关系数据库中如何进行属性约简,以获得最高效的数据挖掘,是本文研究的重点。本文根据一种基于粗糙集理论的数据挖掘方法,以市场调查数据为研究对象,通过适当的约简算法,得出简化的决策集,分析私家车潜在消费者群体特征。提出了一种启发式的约简算法,在属性约简之前,首先定义了一种条件属性分类能力强度,根据各属性分类能力强度对决策表进行排序,然后采用逐行扫描的方法逐条判断属性是否为不必要属性,解决了属性约简可能出现多个约简结果需要靠人为选取满意结果的问题。本人根据论文设计过程的需要,利用Delphi进行程序设计加上利用SQL Sever2000存储数据,最终完成了属性约简、值约简模块的编程实现,这样更直观的展示了实践的过程及研究的结果。
|
全文目录
摘要 4-5 Abstract 5-9 第一章 绪论 9-12 1.1 数据挖掘概述 9-11 1.2 粗糙集数据分析概述 11-12 第二章 粗糙集的基本理论 12-18 2.1 知识的形式化定义 12-13 2.2 等价关系 13 2.3 知识的粒度 13-14 2.4 粗糙集合 14-15 2.5 约简与核值属性 15 2.6 相对约简与相对核 15-16 2.7 知识表达系统 16-18 第三章 数据预处理 18-21 3.1 数据预处理的意义 18 3.2 离散化 18-19 3.3 连续属性离散化的方法 19-21 第四章 约简及相关算法 21-32 4.1 基于数据分析的属性约简算法 22-25 4.1.1 基本定义 22-24 4.1.2 算法描述 24-25 4.2 基于逻辑判断的属性值约减方法 25-32 4.2.1 决策逻辑语言 25-26 4.2.2 一种属性值约简算法 26-28 4.2.3 算例 28-32 第五章 粗糙集数据挖掘应用案例及编程实现 32-63 5.1 案例背景 32-33 5.2 编程工具选择 33-35 5.2.1 操作系统Windows XP的特点 33-34 5.2.2 程序设计工具Delphi7的特点 34 5.2.3 数据库SQL Sever 2000的特点 34-35 5.3 数据表格建立及存储 35-39 5.3.1 属性约简需要的数据 35-37 5.3.2 值约简需要的数据 37-39 5.4 属性约简模块 39-51 5.4.1 属性排序 39 5.4.2 属性约简算法概述 39-40 5.4.3 属性约简程序流程图 40-41 5.4.4 属性约简模块界面简介 41-42 5.4.5 属性约简关键代码说明 42-51 5.4.6 属性约简结果 51 5.5 值约简模块 51-63 5.5.1 值约简算法概述 51-52 5.5.2 值约简模块程序流程图 52-53 5.5.3 值约简模块界面简介 53-54 5.5.4 值约简模块关键代码 54-60 5.5.5 值约简结果 60-61 5.5.6 约简结果分析 61-63 第六章 总结与展望 63-65 6.1 总结 63 6.2 展望 63-65 参考文献 65-70 致谢 70-71 附录A(攻读硕士学位期间发表的论文) 71
|
相似论文
- 基于支持向量机的故障诊断方法研究,TP18
- 基于数据挖掘技术的保健品营销研究,F426.72
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
- 基于连锁图的QTL综合分析方法研究,S562
- Bicluster数据分析软件设计与实现,TP311.52
- 基于变异粒子群的聚类算法研究,TP18
- 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- 基于粗糙集的城市区域交通绿时控制系统研究,TP18
- 基于数据挖掘的税务稽查选案研究,F812.42
- 面向社区教育的个性化学习系统的研究与实现,TP391.6
- 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
- 数据仓库技术在银行客户管理系统中的研究和实现,TP315
- 基于行业参数优化模型的投资项目决策支持系统,F283
- 数据集市在电信经营分析中的应用研究,TP311.13
- 数据挖掘在高职院校学生成绩分析中的应用,TP311.13
- 基于数据挖掘的个性化在线教学辅助系统的研究与设计,TP311.13
- 基于数据挖掘的课程考核与分析决策系统的设计和实现,TP311.13
- 基于Moodle的高职网络教学系统设计与实现,TP311.52
- 教学质量评估数据挖掘系统设计与开发,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|