学位论文 > 优秀研究生学位论文题录展示
基于遗传算法的关联规则数据挖掘技术研究
作 者: 韩宏博
导 师: 郑有才
学 校: 西安电子科技大学
专 业: 计算机软件与理论
关键词: 数据挖掘 关联规则 遗传算法 兴趣项集 规则范式
分类号: TP311.13
类 型: 硕士论文
年 份: 2010年
下 载: 94次
引 用: 0次
阅 读: 论文下载
内容摘要
数据挖掘已经在许多行业的决策支持中起到关键的作用。其中,关联规则数据挖掘是数据挖掘中成果颇丰的研究分支,从各种事务数据库中发现的关联规则可以帮助许多决策的制定,对关联规则挖掘的研究已经成为数据挖掘领域的一个重要研究方向。本文在研究数据挖掘、关联规则挖掘技术的基础上,分析推导出一条频繁项集潜在的性质,并应用这条性质对Apriori算法进行了初步改进。从获取用户具体挖掘需求的角度出发,提出了兴趣项集、规则范式的概念,并在这两个概念的基础上对Apriori算法再次改进。然后,在综合这两个改进算法的基础上,提出了I_ Apriori挖掘算法。随后,依据遗传算法具备高效全局优化的优点,提出了基于遗传算法的Algorithm_BasedGA挖掘算法。最后,针对一个具体的关联规则挖掘的应用实例,设计了并实现了挖掘系统,核心挖掘算法分别使用Apriori算法、I_Apriori算法、Algorithm_BasedGA算法。结果表明两种改进的算法的正确性和有效性,而且运行时间的对比上在整体上优于以Apriori为代表的传统的关联规则挖掘算法。
|
全文目录
摘要 3-4 Abstract 4-7 第一章 绪论 7-13 1.1 课题研究背景 7-8 1.2 课题研究现状 8-10 1.2.1 数据挖掘的进展 8 1.2.2 关联规则的研究现状 8-9 1.2.3 遗传算法在数据挖掘中的应用 9-10 1.3. 论文的主要工作 10 1.4. 论文的章节安排 10-13 第二章 关联规则挖掘研究 13-29 2.1 数据挖掘概述 13-16 2.1.1 数据挖掘的相关概念 13-14 2.1.2 数据挖掘的方法和技术 14-15 2.1.3 数据挖掘的知识表示 15 2.1.4 数据挖掘的过程 15-16 2.2 关联规则挖掘概述 16-19 2.2.1 关联规则的概念 16-17 2.2.2 关联规则的种类 17-18 2.2.3 关联规则的价值衡量方法 18-19 2.3 常见的关联规则挖掘算法 19-22 2.3.1 关联规则挖掘的步骤 19 2.3.2 基本的关联规则挖掘算法 19-21 2.3.3 复杂关联规则挖掘算法 21-22 2.4 Apriori算法研究 22-28 2.4.1 Apriori算法描述 22-24 2.4.2 Apriori算法解析 24-28 2.4.3 对Apriori算法改进的设想 28 2.5 本章小结 28-29 第三章 基于遗传算法的关联规则挖掘研究 29-47 3.1 关联规则挖掘改进研究 29-36 3.1.1 基于频繁项集性质的挖掘算法 29-31 3.1.2 基于兴趣项集和规则范式的挖掘算法 31-34 3.1.3 改进的关联规则挖掘算法(I_Apriori) 34-36 3.2 遗传算法 36-39 3.2.1 基本思想 36 3.2.2 处理流程 36-37 3.2.3 遗传算子 37-38 3.2.4 遗传算法的编码方法 38-39 3.3 基于遗传算法的关联规则挖掘研究 39-45 3.3.1 关联规则挖掘的特点分析 39 3.3.2 使用遗传算法的可能性 39-40 3.3.3 算法思想 40 3.3.4 算法描述(Algorithm_BasedGA) 40-41 3.3.5 算法详解 41-45 3.4 本章小结 45-47 第四章 实现与验证 47-75 4.1 应用背景介绍 47-48 4.2 挖掘系统设计 48-50 4.2.1 系统模型 48 4.2.2 开发环境 48 4.2.3 数据预处理 48-50 4.3 挖掘算法的实现 50-71 4.3.1 Apriori算法的实现 50-56 4.3.2 I_Apriori算法的实现 56-59 4.3.3 Algorithm_BasedGA算法的实现 59-70 4.3.4 结果分析 70-71 4.4 算法性能对比分析 71-73 4.5 本章小结 73-75 第五章 结束语 75-77 5.1 本文工作总结 75 5.2 本文工作展望 75-77 致谢 77-79 参考文献 79-81 作者在读研期间的研究成果 81
|
相似论文
- 天然气脱酸性气体过程中物性研究及数据处理,TE644
- 压气机优化平台建立与跨音速压气机气动优化设计,TH45
- 基于数据挖掘技术的保健品营销研究,F426.72
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
- 基于遗传算法的模糊层次综合评判在高职教学评价中的应用,G712
- 部队人员网上训练与考核系统的开发,TP311.52
- 基于并行算法的模糊综合评价模型的设计与应用,TP18
- 基于神经网络的牡蛎呈味肽制备及呈味特性研究,TS254.4
- 基于遗传算法的中短波磁天线的设计及实现,TN820
- 基于遗传算法的柑橘图像分割,TP391.41
- 基于混合自适应遗传算法的动态网格调度问题研究,TP393.09
- 基于遗传—牛顿算法的公交优化调度,TP18
- 基于遗传算法优化的BP网络对生物柴油制备工艺的优化,TE667
- Bicluster数据分析软件设计与实现,TP311.52
- 基于云理论和蜜蜂进化型遗传算法的纹理合成研究,TP391.41
- 基于变异粒子群的聚类算法研究,TP18
- 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- 基于数据挖掘的税务稽查选案研究,F812.42
- 基于遗传算法的淠史杭灌区渠系配水优化编组模型的研究,S274
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|