学位论文 > 优秀研究生学位论文题录展示
基于关联规则的改进的线性回归预测算法
作 者: 薛向阳
导 师: 姜昱明
学 校: 西安电子科技大学
专 业: 计算机应用技术
关键词: 数据挖掘 关联规则 频繁集 预测 线性回归
分类号: TP311.13
类 型: 硕士论文
年 份: 2009年
下 载: 70次
引 用: 0次
阅 读: 论文下载
内容摘要
数据挖掘是指从大量的数据中发现潜在的、有用的知识的过程。近年来数据挖掘技术成了商业销售领域的核心技术,被广泛应用到了诸多领域,引起了学术界和产业界极大的关注,如何提高数据挖掘的效率成为学术界热门的研究课题。本文主要针对关联规则发现,商业销售预测领域方面的应用研究。本文讨论了数据挖掘的一般理论,包括数据挖掘的概念、任务、模式以及数据挖掘的应用和发展趋势。研究了关联规则中经典的Apriori算法。也深入研究了线性回归分析预测算法,总结了该算法存在的问题,提出了一种基于关联规则的改进的线性回归分析预测算法。该算法的主要思想是先使用线性回归分析算法预测出一种药品的销售金额,然后利用改进的的线性回归分析算法预测与其相互关联的其它药品的销售金额。该算法和线性回归分析算法相比较,减少了时间开销,提高了效率。同时,根据Apriori算法和改进的线性回归分析算法设计了线性回归预测系统,该系统的主要功能是挖掘研究对象的频繁项集,并从频繁项集(不包括频繁1-项集)中挑选出支持数最多的一个项集,对其中的药品利用改进的先性回归分析算法预测其未来几个月的销售金额。最后,将该系统应用到医药销售中,预测药品的销售金额,并对预测结果进行了验证,表明了改进的线性回归预测算法是可行的。本文的工作虽然取得了一定的成果,但尚有大量问题有待于进一步研究,比如,提高预测的准确率;如何将挖掘结果友好地呈现给用户。
|
全文目录
摘要 3-4 Abstract 4-7 第一章 绪论 7-13 1.1 数据挖掘的研究背景 7-8 1.2 数据挖掘中的关联规则和销售预测 8-9 1.3 销售预测的作用 9 1.4 关联规则和回归分析预测算法的研究现状 9-11 1.5 本文工作 11-12 1.6 论文的组织 12-13 第二章 数据挖掘中的关联规则 13-29 2.1 数据挖掘相关介绍 13-19 2.1.1 数据挖掘的定义 13 2.1.2 数据挖掘系统结构 13-14 2.1.3 数据挖掘的数据来源 14-16 2.1.4 数据挖掘的任务 16 2.1.5 数据挖掘的模式类型 16-17 2.1.6 数据挖掘的应用 17-18 2.1.7 数据挖掘的发展趋势 18-19 2.2 关联规则相关介绍 19-27 2.2.1 关联规则的定义 19-21 2.2.2 频繁集的性质 21 2.2.3 关联规则的分类 21-22 2.2.4 挖掘关联规则的基本步骤 22 2.2.5 简单形式的关联规则算法—Apriori算法 22-27 2.3 本章小结 27-29 第三章 线性回归分析预测和线性回归预测算法的改进 29-35 3.1 预测数据挖掘的过程和预测方法 29-30 3.1.1 预测数据挖掘的过程 29 3.1.2 预测的方法 29-30 3.2 线性回归分析算法 30-31 3.2.1 一元线性回归分析预测算法 30-31 3.2.2 一元线性回归分析算法模型及其求解方法 31 3.3 改进的一元线性回归分析预测算法 31-32 3.3.1 改进的一元线性回归分析预测算法 31-32 3.3.2 算法思想 32 3.4 预测误差度量 32-33 3.5 算法应用——药品销售预测 33-34 3.5.1 数据准备与处理 33 3.5.2 月销售额的预测 33-34 3.6 本章小结 34-35 第四章 线性回归预测系统的设计与实现 35-41 4.1 数据选择 35-36 4.1.1 选择要研究的药品 35 4.1.2 属性子集的选择 35 4.1.3 数据抽取 35-36 4.2 系统的总体设计 36-37 4.2.1 挖掘方法 36 4.2.2 模块划分 36 4.2.3 系统的总体层次结构 36-37 4.3 系统实现 37-38 4.4 系统实现的关键技术 38-40 4.4.1 数据抽取技术 38-39 4.4.2 双数组穷举判断技术 39 4.4.3 预测表技术 39-40 4.5 本章小结 40-41 第五章 线性回归预测系统在医药批发中的应用 41-47 5.1 预测药品的选择 41-44 5.1.1 数据准备与处理 41-42 5.1.2 挖掘频繁项集 42-44 5.2 药品销售金额的预测 44-45 5.2.1 改进的一元线性回归预测模块对"小盐水"月销售金额的预测 44 5.2.2 一元线性回归预测模块对"小盐水"月销售额金额的预测 44-45 5.3 结果比较和分析 45 5.4 本章小结 45-47 第六章 结束语 47-49 致谢 49-51 参考文献 51-53 研究成果 53
|
相似论文
- K公司计划及预测改进对于合理库存配置的研究,F224
- 基于图的标志SNP位点选择算法研究,Q78
- 液力减速器制动性能及用于飞机拦阻的仿真研究,TH137.331
- 深空撞击探测末制导律的设计与分析,V448.2
- 卫星姿态的磁控制方法研究,V448.222
- Hall推进器寿命预测和壁面侵蚀加速实验研究,V439.2
- 高精度激光跟踪装置闭环控制若干关键问题研究,TN249
- 网络语音传输丢包的恢复技术,TN912.3
- 基于神经网络的水厂投药预测控制研究,TP273.1
- 网络化系统的鲁棒模型预测控制,TP273
- 硝酸钠制配过程中pH值的预测控制及仿真研究,TP273
- 离散非线性系统输入到状态稳定性研究,TP13
- 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
- 基于数据挖掘技术的保健品营销研究,F426.72
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
- 山西省人口中长期发展变化趋势预测,O212.1
- 云南省勐腊县南坡铜矿床成矿规律与成矿预测研究,P618.41
- 计算智能在数字化卷烟叶组配方中的应用研究,TS44
- 地州级卷烟销量预测影响因素研究,F224
- 基于不确定性系统研究方法的高校学生学习成绩分析与预测,G642.4
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|