学位论文 > 优秀研究生学位论文题录展示

增量关联规则算法及其在食品安全监管中的应用

作 者: 徐燕伟
导 师: 杜树新
学 校: 浙江大学
专 业: 模式识别与智能系统
关键词: 数据挖掘 食品安全 关联规则 频繁项集 稀疏数据 增量更新
分类号: TP311.13
类 型: 硕士论文
年 份: 2008年
下 载: 183次
引 用: 0次
阅 读: 论文下载
 

内容摘要


数据挖掘方法应用到食品安全领域,可以使得海量的食品检测数据得到及时的跟踪分析,尽早地揭示其潜在的规律与异常,为食品安全的检疫监督工作提供决策支持。关联规则挖掘是研究数据潜在有趣模式的一项重要而基础性的方法,它揭示数据库各属性之间的内在关联,以易于理解的方式向用户提供大量的有趣规则。本文探讨了在食品安全检测数据库上如何应用关联规则挖掘,以及在数据库更新时,如何对已有的规则进行更新的方法。主要研究工作有:1)结合频繁项集挖掘方法的难点,分析了食品安全检测数据的各种特性,如多维度、类别属性、分布不均衡且稀疏等,讨论了频繁项集挖掘算法的复杂度与数据集本身特征之关系。2)提出了一种针对食品安全数据的稀疏特性的选择性过滤算法SSF(Selective Skeching Filter),此算法通过过滤信息冗余属性,可以为频繁项集挖掘算法和更新算法提供更小的候选1—项集,也过滤了由冗余属性值引发的大量的伪关联规则,从而大大提高了挖掘和更新算法的性能,便于根据兴趣度筛选出有意义的规则。3)针对食品安全检测数据的动态性,本文提出一种新的频繁项集更新算法UWP(Update With Portions)。在该算法中,将更新后的频繁项集分成三个子集分别处理,无需从头计算所有的候选项集,并且利用了负性边缘的性质来有效减少扫描整个数据库的I/O代价;最后,在给定食品数据集的条件下,本文对使用UWP算法来实现增量更新,与利用Apriori算法挖掘全部频繁项集,进行了对比实验。实验结果表明,该算法具有高效,可组件化,通用性强的特点。

全文目录


摘要  4-5
Abstract  5-6
致谢  6-7
目录  7-9
第一章 绪论  9-19
  1.1 数据挖掘问题的提出  9-10
  1.2 关联规则挖掘技术  10-14
    1.2.1 关联规则的概念  10
    1.2.2 关联规则挖掘问题分解  10-11
    1.2.3 关联规则算法研究现状  11-13
    1.2.4 Apriori算法概述  13-14
  1.3 课题研究意义  14-17
    1.3.1 食品安全监管数据挖掘研究意义  14-16
    1.3.2 增量关联规则研究意义  16-17
  1.4 本文的工作  17-19
第二章 关联挖掘的增量更新算法  19-27
  2.1 引言  19-20
  2.2 增量式更新问题描述  20
  2.3 增量更新算法研究现状  20-22
  2.4 FUP算法  22-27
    2.4.1 FUP算法的基本思想  22-23
    2.4.2 FUP算法描述  23-25
    2.4.3 FUP算法的不足  25-27
第三章 数据分析与算法优化  27-39
  3.1 频繁项集挖掘的复杂度  27-28
  3.2 食品检测数据分析  28-33
    3.2.1 数据的来源与准备  28-29
    3.2.2 数据的一般特点  29-31
    3.2.3 数据的稀疏性  31-33
  3.3 优化方案  33-37
    3.3.1 方法意义  33-34
    3.3.2 算法实现  34-35
    3.3.3 实验结果  35-37
  3.4 本章小结  37-39
第四章 UWP增量算法  39-49
  4.1 UWP算法原理  39-43
    4.1.1 问题描述  39-40
    4.1.2 UWP算法基本原理  40-43
  4.2 UWP算法步骤  43-44
  4.3 对比实验  44-48
    4.3.1 实验设计与实验条件  44-45
    4.3.2 对比实验结果  45-47
    4.3.3 实验结果分析  47-48
  4.4 本章小结  48-49
第五章 总结与展望  49-51
  5.1 本文完成的主要工作和成果  49
  5.2 对未来的展望  49-51
参考文献  51-55
附录  55
  作者简介  55
  攻读硕士学位期间录用及完成的论文  55
  攻读硕士学位期间参与的科研项目  55

相似论文

  1. 大规模稀疏关系数据索引技术研究,TP311.132.3
  2. 基于数据挖掘技术的保健品营销研究,F426.72
  3. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  4. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  5. 畜产品质量安全保障监管RFID系统,TS201.6
  6. Bicluster数据分析软件设计与实现,TP311.52
  7. 基于变异粒子群的聚类算法研究,TP18
  8. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  9. 基于遗传算法和粗糙集的聚类算法研究,TP18
  10. 对食品企业员工认知水平及消费者满意度的调查,F224
  11. HACCP体系原理在辣椒保健食品生产中的应用,TS218
  12. 食品安全视角下蛋鸡养殖户饲料购买行为分析,F326.3
  13. 稀疏数据矩阵条件下应用公式法估计方差分量的影响因素研究,O212.1
  14. 膨松剂在食品中应用的调查与研究分析,TS202.3
  15. 基于数据挖掘的税务稽查选案研究,F812.42
  16. Y食品企业多体系管理的研究,F426.82
  17. 湖北省食品企业生产环节存在的安全问题及对策研究,F203
  18. 面向社区教育的个性化学习系统的研究与实现,TP391.6
  19. 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
  20. 数据仓库技术在银行客户管理系统中的研究和实现,TP315
  21. 基于Moodle的高职网络教学系统设计与实现,TP311.52

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com