学位论文 > 优秀研究生学位论文题录展示
面向分类预测的增量关联规则应用研究
作 者: 廖旺宇
导 师: 刘芳
学 校: 四川师范大学
专 业: 计算机软件与理论
关键词: 数据挖掘 关联规则 分类预测 增量更新 频繁谓词集
分类号: TP311.13
类 型: 硕士论文
年 份: 2010年
下 载: 39次
引 用: 0次
阅 读: 论文下载
内容摘要
数据库技术以及计算机硬件技术的飞速发展使得搜集更多有用的数据成为可能。然而,大量的数据在一定程度上为描述特征、制定决策带来便利的同时,也将数据的处理者带入了“数据丰富,但知识贫乏”的窘境当中。为了打破这一窘境,高效处理数据、发掘潜在有用信息,数据挖掘技术在20世纪80年代应运而生,并得到了飞速发展。在数据挖掘的众多分支中,关联规则挖掘和分类的应用研究又是两个具有高活跃度的重要领域。由于它们都有挖掘相关性强的项目集的显著共性,将关联规则挖掘用于解决数据挖掘中的分类应用的研究工作也就逐步展开并深入了。研究发现,由于关联规则挖掘方法可以同时考虑多个属性之间的高置信度关联,将它用于分类应用往往可以获得比当前最为常用的决策树方法更高的准确率。本文在对国内外将关联规则用于分类应用的研究现状进行简要分析的基础上,首先介绍了数据挖掘的产生、基本概念、过程以及功能等。其中,又着重对关联规则挖掘进行了概述,包括其定义、经典算法,以及增量关联规则的更新等。随后,在第三章论证了提出面向分类预测的增量关联规则更新应用研究的必要性。在此基础上,提出了最小支持度阈值(minsup)和最小置信度阈值(minconf)发生改变时高效更新分类预测关联规则的一个改进算法,然后以此改进算法为基础,进一步提出了当目标数据集中数据增加或者减少时高效更新分类预测关联规则的两个新算法。论文对三个算法的算法基础、算法描述,以及算法有效性实验和结果分析分别进行了阐述。在第四章中,以UCI数据集中的German Credit Data真实银行信贷审核分类数据集作为实例进行了面向分类预测的增量关联规则挖掘系统的设计与实现,进一步检验了所提出的算法的有效性。本文所做的工作对于客户管理和商业应用中的面向分类预测的数据挖掘技术,如进行客户关系管理、商品销售分析、推进商业和金融业等行业智能化等方面都具有一定的指导和借鉴意义。
|
全文目录
中文摘要 3-5 Abstract 5-9 第一章 绪论 9-14 1.1 研究背景和意义 9 1.2 国内外研究现状 9-12 1.2.1 关联规则挖掘研究的现状 10 1.2.2 数据挖掘中分类预测应用的研究现状 10-12 1.3 本文主要研究内容和所做工作 12-13 1.4 研究方法和论文框架结构 13-14 第二章 关联规则挖掘及更新概述 14-21 2.1 数据挖掘概述 14-18 2.1.1 数据挖掘技术的产生和概念 14 2.1.2 数据挖掘的过程 14-16 2.1.3 数据挖掘功能 16-18 2.2 关联规则挖掘与更新概述 18-21 2.2.1 关联规则挖掘概述 18-19 2.2.2 关联规则挖掘的经典算法概述 19 2.2.3 增量关联规则更新概述 19-21 第三章 面向分类预测的增量关联规则更新算法 21-45 3.1 算法的必要性 21 3.2 minsup 和minconf 改变时的分类预测增量关联规则更新算法 21-29 3.2.1 算法基础 21-22 3.2.2 算法描述 22-25 3.2.3 算法有效性实验及结果分析 25-29 3.3 数据增加时的分类预测增量关联规则更新算法 29-36 3.3.1 算法基础 29-30 3.3.2 算法描述 30-32 3.3.3 算法有效性实验及结果分析 32-36 3.4 数据减少时的分类预测增量关联规则更新算法 36-45 3.4.1 算法基础 36-38 3.4.2 算法描述 38-40 3.4.3 算法有效性实验及结果分析 40-45 第四章 银行信贷风险分类系统设计应用实例与检测评价 45-71 4.1 实验环境及系统功能模块介绍 45-47 4.1.1 实验环境 45 4.1.2 系统功能模块 45-47 4.2 数据库连接设置 47 4.3 导入数据 47-48 4.4 银行信贷数据的预处理 48-60 4.4.1 数据准备及数据描述 48-52 4.4.2 数据离散化 52-55 4.4.3 属性约减 55-60 4.5 分类增量关联规则的获取 60-71 4.5.1 最小支持度改变时的关联规则获取 60-63 4.5.2 正增量关联规则获取 63-66 4.5.3 负增量关联规则获取 66-71 第五章 总结和展望 71-74 5.1 总结 71-72 5.2 展望 72-74 参考文献 74-78 致谢 78-79 研究生在校期间的科研成果 79
|
相似论文
- 基于数据挖掘技术的保健品营销研究,F426.72
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
- Bicluster数据分析软件设计与实现,TP311.52
- 基于变异粒子群的聚类算法研究,TP18
- 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- 基于数据挖掘的税务稽查选案研究,F812.42
- 面向社区教育的个性化学习系统的研究与实现,TP391.6
- 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
- 数据仓库技术在银行客户管理系统中的研究和实现,TP315
- 基于Moodle的高职网络教学系统设计与实现,TP311.52
- 教学质量评估数据挖掘系统设计与开发,TP311.13
- 关联规则算法在高职院校贫困生认定工作中的应用,G717
- 基于数据挖掘技术在城市供水的分析与决策,F299.24;F224
- 数据挖掘技术在电视用户满意度分析中的应用研究,TP311.13
- Web使用挖掘与网页个性化服务推荐研究,TP311.13
- 数据挖掘在学校管理和学生培养中的应用,TP311.13
- 高校毕业生就业状况监测系统研究,G647.38
- 基于数据仓库的药品监管辅助决策支持系统的设计与实现,TP311.13
- 基于关联规则的结构化浏览技术及其应用,TP391.41
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|