学位论文 > 优秀研究生学位论文题录展示

增量式优化关联规则算法研究及应用

作 者: 李佳
导 师: 闫仁武
学 校: 江苏科技大学
专 业: 计算机应用技术
关键词: 数据挖掘 关联规则 增量更新 Apriori算法优化 Apriori~+
分类号: TP311.13
类 型: 硕士论文
年 份: 2010年
下 载: 52次
引 用: 0次
阅 读: 论文下载
 

内容摘要


作为数据挖掘中的一个重要领域,关联规则挖掘目前已在商业、科研、客户资源管理等领域有了许多非常成功应用,这使它成为数据挖掘和知识发现领域中最成熟、最重要、最引人关注的一个分支。自从关联规则的概念被引入,以及第一个关联规则算法Apriori算法被提出以来,由于其具有巨大的商业应用价值和理论研究价值,诸多研究人员对关联规则挖掘算法进行了广泛的研究并提出了许多新的关联规则挖掘算法,这些关联规则挖掘算法在原有的基础进行了优化、改进,使挖掘的效率不断提高,它们各具特点,也存在着诸多不足。另外,在关联规则挖掘中还存在着两个需要解决的问题:当被挖掘的数据不断更新时,算法仍然可以继续高效即时地获得所需的结果;当用户在挖掘规则的过程中需预先设定一些挖掘参数来获取想要的规则,但这些参数设置往往要通过多次的调整才能达到预期的目的,那么如何在多次调整中进行高效的计算?这些都是关联规则增量更新挖掘算法所要解决的问题。本文在总结前人的研究成果的基础上,对增量型关联规则挖掘算法进行了研究,主要内容归纳为:(1)介绍了数据挖掘,关联规则理论的相关概念及应用,并对经典的Apriori关联规则挖掘算法进行研究,并分析了其优缺点。(2)对当数据不断更新时的关联规则挖掘技术进行研究,分析了FUP算法的理论基础及算法描述,并对其优缺点进行总结。针对大部分增量更新关联规则挖掘算法要对数据库进行多次扫描,并无法根据时间区间来区分不同数据的重要性,本文提出了新的基于时间权值的增量优化关联规则挖掘算法——Apriori+。(3)简述了Apriori+算法在零售业交叉销售领域的应用,并通过实验证明了其有效性。

全文目录


摘要  2-3
Abstract  3-9
第1章 绪论  9-15
  1.1 研究课题背景  9
  1.2 课题的意义  9-13
    1.2.1 研究现状  9-12
    1.2.2 现有更新算法的不足  12
    1.2.3 将时间权值应用于更新算法的优点  12-13
  1.3 课题研究的内容及思路  13
  1.4 论文组织结构章节安排  13-15
第2章 关联规则挖掘概述  15-24
  2.1 数据挖掘的基本概念  15
  2.2 数据挖掘的分类  15-16
  2.3 数据挖掘的方法  16-17
  2.4 数据挖掘的流程  17-18
  2.5 关联规则的基本概念  18-19
  2.6 关联规则的挖掘步骤  19-20
  2.7 关联规则的主要研究方向及算法  20-21
  2.8 经典的Apriori 算法  21-23
    2.8.1 Apriori 算法简介及分析  21-23
    2.8.2 Apriori 算法存在的问题  23
  2.9 本章小结  23-24
第3章 增量更新关联规则挖掘算法概述  24-28
  3.1 增量更新关联规则挖掘算法的定义  24-25
  3.2 FUP 算法  25-27
    3.2.1 FUP 算法的基本思想  25
    3.2.2 FUP 算法的描述  25-26
    3.2.3 FUP 算法的不足  26-27
  3.3 本章小结  27-28
第4章 基于时间权重的增量关联规则挖掘算法Apriori~+  28-41
  4.1 算法背景  28
  4.2 时间权值的定义及性质  28-34
    4.2.1 时间权值的定义  28-29
    4.2.2 时间权值的性质  29-34
  4.3 k-最小支持数及其定义  34-36
    4.3.1 SC(X)的定义  34
    4.3.2 Apriori 频繁项集与加权频繁项集  34-35
    4.3.3 SC(X)的性质  35-36
  4.4 项计数统计表  36
  4.5 算法描述  36-40
  4.6 本章小结  40-41
第5章 Apriori+算法的使用实例及结果分析  41-51
  5.1 Apriori+算法在零售业交叉销售中的应用  41-44
    5.1.1 交叉销售概述  41
    5.1.2 数据挖掘技术在交叉销售上的应用  41-42
    5.1.3 零售业实行交叉销售的意义  42-43
    5.1.4 Apriori+算法用于零售业交叉销售的优点  43-44
  5.2 实验数据源分析  44-47
  5.3 实验数据的预处理  47-48
  5.4 实验结果分析  48-50
    5.4.1 试验环境  48
    5.4.2 试验方法  48-49
    5.4.3 评测结果  49-50
  5.5 本章小结  50-51
结束语  51-53
参考文献  53-57
攻读硕士学位期间发表的学术论文  57-59
致谢  59-60
详细摘要  60-64

相似论文

  1. 基于数据挖掘技术的保健品营销研究,F426.72
  2. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  3. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  4. Bicluster数据分析软件设计与实现,TP311.52
  5. 基于变异粒子群的聚类算法研究,TP18
  6. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  7. 基于遗传算法和粗糙集的聚类算法研究,TP18
  8. 基于数据挖掘的税务稽查选案研究,F812.42
  9. 面向社区教育的个性化学习系统的研究与实现,TP391.6
  10. 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
  11. 数据仓库技术在银行客户管理系统中的研究和实现,TP315
  12. 基于Moodle的高职网络教学系统设计与实现,TP311.52
  13. 教学质量评估数据挖掘系统设计与开发,TP311.13
  14. 关联规则算法在高职院校贫困生认定工作中的应用,G717
  15. 基于数据挖掘技术在城市供水的分析与决策,F299.24;F224
  16. 数据挖掘技术在电视用户满意度分析中的应用研究,TP311.13
  17. Web使用挖掘与网页个性化服务推荐研究,TP311.13
  18. 数据挖掘在学校管理和学生培养中的应用,TP311.13
  19. 高校毕业生就业状况监测系统研究,G647.38
  20. 基于数据仓库的药品监管辅助决策支持系统的设计与实现,TP311.13
  21. 基于关联规则的结构化浏览技术及其应用,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com