学位论文 > 优秀研究生学位论文题录展示

多维关联规则算法设计

作 者: 喻昌祺
导 师: 林齐宁
学 校: 北京邮电大学
专 业: 管理科学与工程
关键词: 数据挖掘 关联规则 Apriori算法 多维关联规则 计数器算法
分类号: TP311.13
类 型: 硕士论文
年 份: 2006年
下 载: 229次
引 用: 3次
阅 读: 论文下载
 

内容摘要


数据挖掘,也称为数据库中的知识发现(Knowledge Discovery in Database,KDD),是从大量数据中提取出可信、新颖、有效并能被人理解的模式的高级处理过程,而关联规则是其6种模式中的一种。从购物篮分析到电信、银行业等海量数据的分析处理,关联规则已经在商业领域得到了广泛的实际应用,其中,寻找挖掘海量客户数据中的多维关联规则更是潜力无穷。 传统的Apriori算法是基于单维数据库,寻找布尔关联规则的常见算法,但其效率较低,使用范围有限的缺点同样明显,同时对于寻找多维关联规则并不适用。本文在原有Apriori算法的基础上,自主设计了一种计数器算法,通过对目标数据库对象的自主计数,有效地找到了一条寻找多维关联规则的方法,为多维数据库的关联规则挖掘提供了更多的技术支持。 计数器算法除了打破了原有Apriori算法不适用于寻找多维关联规则的缺陷之外,最大的优势在于在寻找多维关联规则的全过程中,只需要扫描一次目标数据库,这大大节省了对系统的负担,尤其是在对海量数据或远程数据库进行关联规则挖掘的时候,提高了整个算法的运行效率。 文章还通过自主编译的计算机程序,利用真实的电信企业用户数据,成功地寻找并输出了多维关联规则,实现了计数器算法的实际应用。

全文目录


摘要  5-6
Abstract  6-10
第一章 绪论  10-17
  1.1 数据挖掘的历史背景  10-11
  1.2 数据挖掘在商业中的应用  11-15
    1.2.1 数据挖掘在市场营销的应用  11-13
    1.2.2 数据挖掘在电信、金融方面的成功案例  13-15
  1.3 各章节内容介绍  15-17
第二章 关联规则Apriori算法简述  17-30
  2.1 数据挖掘的定义及其分类  17-19
    2.1.1 数据挖掘的定义  17
    2.1.2 数据挖掘的分类  17-19
  2.2 关联规则的基本概念及分类  19-24
    2.2.1 研究对象及定义  19-20
    2.2.2 主要参数  20-22
    2.2.3 关联规则的分类  22-24
  2.3 Apriori算法简介  24-30
    2.3.1 Apriori算法主要内容  24-25
    2.3.2 Apriori算法伪代码  25-27
    2.3.3 由频繁项集产生关联规则  27
    2.3.4 一些提高算法有效性的方法  27-30
第三章 寻找多维关联规则中频繁项集方法的总体思路  30-39
  3.1 Apriori原始算法不适合挖掘多维关联规则的原因  30-31
  3.2 多维关联规则的相关概念  31-32
    3.2.1 多维关联规则的定义  31
    3.2.2 多维关联规则的分类  31-32
    3.2.3 挖掘多维关联规则的方法  32
  3.3 基于多维关联规则挖掘的计数器算法的主要思路  32-35
    3.3.1 挖掘数据的前期整理  33
    3.3.2 唯一的一次扫描数据库  33-34
    3.3.3 寻找频繁项集  34-35
    3.3.4 输出强关联规则  35
  3.4 计数器算法的伪代码  35-36
  3.5 算法编译过程中需要注意的问题  36-39
    3.5.1 如何更有效的由频繁(n-1)-项集生成频繁n-项集  36-37
    3.5.2 如何进一步提高初始扫描效率  37
    3.5.3 如何更有效的判断是否存在更高层次的频繁项集  37-39
第四章 挖掘多维关联规则的实际应用  39-53
  4.1 程序的简单介绍  39-45
    4.1.1 例子程序使用的软硬件说明  39
    4.1.2 程序界面及使用说明  39-45
  4.2 程序运行情况及结果  45-51
    4.2.1 随机产生数据库的运行情况  45-47
    4.2.2 使用企业真实数据后的运行情况  47-51
  4.3 算法效率评估  51-53
结束语  53-54
参考文献  54-56
附录  56-62
致谢  62-63
攻读学位期间发表的学术论文目录  63

相似论文

  1. 基于数据挖掘技术的保健品营销研究,F426.72
  2. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  3. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  4. Bicluster数据分析软件设计与实现,TP311.52
  5. 基于变异粒子群的聚类算法研究,TP18
  6. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  7. 基于遗传算法和粗糙集的聚类算法研究,TP18
  8. 教学质量评估数据挖掘系统设计与开发,TP311.13
  9. 关联规则算法在高职院校贫困生认定工作中的应用,G717
  10. 数据挖掘在学校管理和学生培养中的应用,TP311.13
  11. 高校毕业生就业状况监测系统研究,G647.38
  12. 基于关联规则的结构化浏览技术及其应用,TP391.41
  13. 基于数据挖掘的信用卡客户激活与响应度研究,F832.2
  14. PG炼钢厂MES系统数据挖掘的设计与开发,TP311.13
  15. 数据挖掘技术在独立学院教学评估中的应用研究,TP311.13
  16. ⅡS日志挖掘在电子商务网站邮件营销中的应用研究,TP311.13
  17. 六盘水市烟草公司人力资源管理系统信息集成设计实现,TP311.52
  18. 基于WEB平台的家电类产品智能导购系统的研究,TP311.52
  19. 通信行为指纹研究,TP311.13
  20. 基于数据挖掘聚类技术的我国高校分类研究,TP311.13
  21. 纺织品服装出口的TBT风险监测与预警机理研究,TP311.13

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com