学位论文 > 优秀研究生学位论文题录展示
基于粒度原理的聚类分析及规则挖掘技术研究
作 者: 苏永昌
导 师: 夏红霞;钟珞
学 校: 武汉理工大学
专 业: 计算机科学与技术
关键词: 粒度计算 数据挖掘 层次聚类算法 规则挖掘 信息粒
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 67次
引 用: 0次
阅 读: 论文下载
内容摘要
近年来,随着信息技术和数据仓库技术的发展,数据挖掘作为一个全新的信息处理技术迅速发展并逐步走向成熟。数据挖掘就是一种从大量的数据中提取新颖的,隐含的,有效的信息的高级处理过程。聚类分析技术和关联规则挖掘技术是数据挖掘领域中两种有效的信息处理方法。聚类分析是数据挖掘中的一个重要研究领域,是一种数据划分或组处理的重要手段和方法。聚类分析也可以看作一种数据预处理技术,用于发现隐藏在海量数据中的有价值的未知类,为信息的高效分析处理提供技术支持聚类分析已被广泛应用于统计学、机器学习、空间数据库、生物学以及市场营销等领域;关联规则挖掘技术用于从大规模数据库中提取有价值的规则,从而对人类的实践活动提供指导。粒度计算理论是对人类分析和解决问题的过程的一种模拟,它是一种新的信息处理方法,它利用了人类能从不同的粒度去思考、分析和解决问题的重要特性,用于处理一些复杂的、非结构化的、不完整的、不确定的信息。分层递阶这一概念正是粒度计算这一思维方法的重要体现,它很早就已经广泛应用到电子信息,自动控制以及管理决策等学科领域当中已经被应用于许多领域中。本文从数据挖掘的理论出发,着重阐述了聚类分析技术和规则挖掘技术的理论和特点,利用粒度计算的层次化分析解决问题的思想,提出了基于粒度原理的层次规则挖掘算法,它采用“分裂—凝聚”的层次化方法是对数据进行分析归类,有效的解决了传统聚类分析算法在出处理海量数据时存在时空性能方面的不足的问题,并从理论和实验两个角度证明了新算法的可行性和时空效率,具有一定的实用价值。最后,在对传统的关联挖掘方法进行分析研究,了解其特性与不足的基础上,利用信息粒在数据层次化和频繁集求解方面的优势,将粒度原理与规则挖掘方法相结合,得到了基于粒度原理的层次规则挖掘方法,并用实例分析了算法的有效性。
|
全文目录
摘要 4-5 Abstract 5-9 第1章 绪论 9-15 1.1 数据挖掘理论概述 9-12 1.1.1 引言 9 1.1.2 数据挖掘的定义 9 1.1.3 数据挖掘的功能 9-12 1.1.4 数据挖掘的基本步骤 12 1.2 数据挖掘技术的研究方向 12-13 1.3 论文的研究内容 13-15 第2章 粒度计算 15-21 2.1 粒度计算的起源 15-16 2.2 粒度计算的定义 16 2.3 粒度计算的基本成分 16-18 2.4 粒度计算的基本问题 18-19 2.5 粒计算的三大理论模型 19-20 2.5.1 模糊集理论模型 19 2.5.2 Rough集 19-20 2.5.3 商空间理论 20 2.6 本章小结 20-21 第3章 基于粒度原理的层次聚类算法 21-34 3.1 聚类分析概述 21-26 3.1.1 聚类模型描述 23 3.1.2 聚类算法的步骤 23 3.1.3 主要聚类算法分类 23-26 3.2 聚类中的粒度原理 26-27 3.3 聚类中的簇间距离度量方法 27-29 3.3.1 簇间距离的计算 27-28 3.3.2 簇的评估方法 28-29 3.4 粒度空间原理与粒度划分方法 29-32 3.4.1 粒度空间的数学模型 29 3.4.2 粒度划分方法 29-30 3.4.3 算法过程描述及分析 30-31 3.4.4 算法性能分析 31-32 3.5 实验对比分析 32-33 3.6 本章小结 33-34 第4章 基于粒度原理的层次规则挖掘算法 34-48 4.1 规则挖掘 34-37 4.1.1 规则挖掘概述 34 4.1.2 关联规则挖掘算法的步骤 34-35 4.1.3 规则挖掘典型算法 35-37 4.2 规则挖掘中的粒计算 37 4.3 基于粒度计算的规则挖掘的基本模型及相关定义 37-41 4.3.1 关联规则的一般定义 37-38 4.3.2 信息粒及其二进制表示方法 38-39 4.3.3 基于粒度计算的关联规则定义 39-41 4.4 基于粒度原理的层次规则挖掘算法 41-47 4.4.1 数据集的层次化编码 41-43 4.4.2 算法的基本思想 43-44 4.4.3 算法过程及其伪代码描述 44-45 4.4.4 算法举例 45-47 4.4.5 算法性能分析 47 4.5 本章小结 47-48 第5章 结束语 48-50 参考文献 50-54 致谢 54-55 攻读硕士学位期间发表的学术论文 55
|
相似论文
- 基于数据挖掘技术的保健品营销研究,F426.72
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
- Bicluster数据分析软件设计与实现,TP311.52
- 基于变异粒子群的聚类算法研究,TP18
- 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- 基于数据挖掘的税务稽查选案研究,F812.42
- 面向社区教育的个性化学习系统的研究与实现,TP391.6
- 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
- 数据仓库技术在银行客户管理系统中的研究和实现,TP315
- 基于Moodle的高职网络教学系统设计与实现,TP311.52
- 教学质量评估数据挖掘系统设计与开发,TP311.13
- 基于邻域关系的模糊决策系统约简与规则获取,TP18
- 关联规则算法在高职院校贫困生认定工作中的应用,G717
- 基于数据挖掘技术在城市供水的分析与决策,F299.24;F224
- 数据挖掘技术在电视用户满意度分析中的应用研究,TP311.13
- Web使用挖掘与网页个性化服务推荐研究,TP311.13
- 数据挖掘在学校管理和学生培养中的应用,TP311.13
- 高校毕业生就业状况监测系统研究,G647.38
- 基于数据仓库的药品监管辅助决策支持系统的设计与实现,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|