学位论文 > 优秀研究生学位论文题录展示
基于粗糙集理论在数据挖掘中的研究与应用
作 者: 张智顺
导 师: 任广伟
学 校: 贵州大学
专 业: 计算机应用技术
关键词: 数据挖掘 粗糙集 知识发现 属性约简
分类号: TP311.13
类 型: 硕士论文
年 份: 2009年
下 载: 107次
引 用: 1次
阅 读: 论文下载
内容摘要
随着数据库的不断增长,自动从数据库中获取有用的知识成为人们日益迫切的需要。粗糙集理论(Rough Sets)就是在这样背景下不断发展起来的一种用于不精确、不确定数据挖掘与处理的新型数学理论。粗糙集理论也凭借其独特的优势而在KDD领域中具有越来越重要的地位。波兰数学家Z.Pawlak于1982年提出的粗糙集理论是一种新的处理模糊和不确定性知识的数学工具。能有效地分析与处理不精确、不一致、不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律。粗糙集在机器学习、知识获取、决策分析、过程控制等许多领域都得到了广泛的应用。数据挖掘(Data Mining,DM)是从存放在数据库、数据仓库或其它信息库中的大量数据中挖掘有趣知识的过程。许多数据挖掘技术仅仅适用于精确集,不适用于粗糙集,而现实中粗糙集是普遍存在的现象,其最大特点是提供问题所需处理的数据集合之外的任何先验信息,可直接从给定问题出发,达到实现“让数据指导行动”的思想,因此基于粗糙集的数据挖掘模型在信息系统的研究领域具有重要意义。本文结合数据挖掘与粗糙集理论的知识,尤其是属性约简知识。给出了2008年我国北京奥运会部分运动员获奖情况用粗糙集知识进行的例证;提出了基于粗糙集的数据挖掘模型;借助湖南省大中专院校招生就业信息系统,以现在大学生就业为例,用粗糙集理论说明了当今的大学生就业中其转变就业观念是很重要的。
|
全文目录
摘要 5-6 Abstract 6-7 第一章 绪论 7-11 1.1 研究背景 7-8 1.2 研究意义 8-9 1.3 国内外研究现状 9 1.4 论文的主要研究内容 9-10 1.5 论文结构 10-11 第二章 数据挖掘与知识发现理论 11-21 2.1 数据挖掘问题的提出 11 2.2 数据挖掘的研究现状 11-12 2.2.1 数据挖掘理论的基础研究 11-12 2.2.2 挖掘方法和用户交互问题 12 2.3 数据挖掘任务 12-14 2.3.1 关联分析 12-13 2.3.2 时序模式 13 2.3.3 聚类 13 2.3.4 分类 13-14 2.3.5 偏差检测 14 2.3.6 预测 14 2.4 数据挖掘分类 14-16 2.4.1 按数据库类型分类 15 2.4.2 按数据挖掘对象分类 15 2.4.3 按数据挖掘任务分类 15 2.4.4 按数据挖掘方法与技术分类 15-16 2.5 数据挖掘的主要方法 16-17 2.5.1 概念或类描述 16 2.5.2 关联分析 16 2.5.3 分类和预测分析 16 2.5.4 聚类分析 16 2.5.5 独立点分析 16-17 2.5.6 演变分析 17 2.5.7 复杂类型的数据挖掘 17 2.6 数据挖掘的知识表示 17-18 2.6.1 规则 17-18 2.6.2 决策树 18 2.7 知识发现的过程 18-21 2.7.1 数据准备 19-20 2.7.2 数据挖掘 20 2.7.3 结果的解释和评估 20-21 第三章 粗糙集理论知识概述 21-38 3.1 粗糙集概念 21-28 3.1.1 信息系统的定义 21-22 3.1.2 集合论的相关概念 22-24 3.1.3 集合知识、知识库与范畴的概念 24-25 3.1.4 上下近似 25-28 3.2 属性约简 28-32 3.3 属性的依赖 32-33 3.4 几种常见的约简算法 33-34 3.4.1 基本算法 33 3.4.2 基于差别矩阵的启发式算法 33 3.4.3 遗传算法 33 3.4.4 扩展法则约简算法 33 3.4.5 动态约简算法 33-34 3.4.6 复合系统的约简算法 34 3.5 决策表 34-35 3.6 粗糙集理论的应用情况 35-36 3.7 粗糙集理论发展趋势 36-38 第四章 一种基于粗糙集的数据挖掘模型与算法 38-42 4.1 数据挖掘过程 38 4.2 一种基于粗糙集的数据挖掘模型 38-40 4.3 粗糙集理论中关键环节算法设计 40-42 第五章 基于粗糙集理论在大学生就业中的属性约简 42-58 5.1 当今大学生就业形式严峻 42 5.2 湖南省大中专院校毕业生就业信息平台 42-44 5.3 数据前处理 44-45 5.4 原始数据的清洗 45-46 5.5 实验 46-58 5.5.1 创建决策表 46-47 5.5.2 构建实验数据 47-49 5.5.3 构建决策表 49-50 5.5.4 产生差别矩阵 50-52 5.5.5 属性约简 52-53 5.5.6 规则提取 53-54 5.5.7 与传统数据挖掘对比 54-55 5.5.8 利用规则指导实践 55-56 5.5.9 实验结果分析与总结 56-58 第六章 结论和展望 58-59 6.1 结论 58 6.2 展望 58-59 致谢 59-60 参考文献 60-62 附录 62-63
|
相似论文
- 基于支持向量机的故障诊断方法研究,TP18
- 基于数据挖掘技术的保健品营销研究,F426.72
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
- 基于连锁图的QTL综合分析方法研究,S562
- Bicluster数据分析软件设计与实现,TP311.52
- 基于变异粒子群的聚类算法研究,TP18
- 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- 基于粗糙集的城市区域交通绿时控制系统研究,TP18
- 基于数据挖掘的税务稽查选案研究,F812.42
- 面向社区教育的个性化学习系统的研究与实现,TP391.6
- 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
- 数据仓库技术在银行客户管理系统中的研究和实现,TP315
- 基于Moodle的高职网络教学系统设计与实现,TP311.52
- 教学质量评估数据挖掘系统设计与开发,TP311.13
- 粗糙集的增量式属性约简研究,TP18
- 知识粒度的计算及其在属性约简中的应用研究,TP18
- 关联规则算法在高职院校贫困生认定工作中的应用,G717
- 基于数据挖掘技术在城市供水的分析与决策,F299.24;F224
- 数据挖掘技术在电视用户满意度分析中的应用研究,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|