学位论文 > 优秀研究生学位论文题录展示

上下文环境下探测概念漂移的算法研究

作 者: 杜飞
导 师: 张立群
学 校: 山东大学
专 业: 计算机软件与理论
关键词: 流程挖掘 概念漂移 上下文环境 漂移点侦测 跟随矩阵
分类号: TP311.13
类 型: 硕士论文
年 份: 2013年
下 载: 7次
引 用: 0次
阅 读: 论文下载
 

内容摘要


流程挖掘在社会日常生产工作中起到非常重要的作用。但是,由于当今市场的竞争和技术的升级,系统的流程会趋向于弹性化、灵活化。因此,需要感知系统流程变化和变化后的流程对于当前系统运作的影响,以及如何优化和控制变化后的物质资源和人力资源的分配。目前,在复杂的流程中很难通过人工的方式检测流程各个点的细小变化,此时需要一定的技术用来自动的动态监测复杂流程系统中流程的变化。通过检查流程的变化可以及时对整体流程做出调节、优化。当系统流程出现问题时,可以清楚的、方向明确地排查问题根源。在流程挖掘领域,这项技术称为“基于流程挖掘的概念漂移的侦测”。传统的流程挖掘领域中概念漂移算法大多对变化识别率低、算法复杂度高,更为重要的是没有应用到流程的上下文周边环境。流程上下文环境的应用将会是流程挖掘领域的下一个突破点。本文在原有的研究基础上,提出了一种新型的算法。该算法通过计算样本之间的结构属性(关联系数、关系熵、跟随矩阵),以及上下文属性(时间属性,人员属性),利用属性矩阵获得日志之间的距离,利用假设检验技术实现对样本的处理,发现流程运行中发生的概念漂移。算法出于时间复杂度的考虑,利用流程变化前后的稳定性,同时为减少对样本属性的提取与计算,通过先计算大日志块,然后逐步细化,最后将漂移点收敛至概念漂移发生的位置,从而侦测到概念漂移。另一方面,算法为了提高精确度,利用上下文环境中时间的变化和任务完成者的变化来提高算法对流程变化的敏感性。本文最后设计了相关实验对算法验证。试验结果表明,在日志规模在200、2000、20000的情况下,本文提出的算法均能发现所有的漂移点,并且不会出现参数误判现象;但是原始算法在200、20000日志规模情况下,会发生漂移的丢失或者误判现象。通过本文的论述和实验,本文提出的算法无论是在理论设计上,还是实验结果上,相对于已有的研究成果都有了不同程度的进步,从时间效率、精确度上均表现出了非常优异的效果。

全文目录


摘要  8-9
ABSTRACT  9-11
第1章 绪论  11-17
  1.1 课题的研究背景和意义  11-13
  1.2 国内外研究现状  13-15
  1.3 本文的主要研究内容  15
  1.4 组织结构  15-16
  1.5 本章小结  16-17
第2章 流程挖掘相关技术  17-30
  2.1 流程挖掘及其技术分类  17-20
  2.2 事件日志  20-23
  2.3 Petri-net  23-25
  2.4 流程挖掘常用算法  25-28
    2.4.1 基于Petri网模型的挖掘算法  25-27
    2.4.2 启发式挖掘算法  27-28
    2.4.3 混合型挖掘算法  28
  2.5 流程挖掘的指导原则  28-30
第3章 样本特征的设计与提取  30-41
  3.1 结构参数  30-32
    3.1.1 关系计数  30-31
    3.1.2 关系熵  31
    3.1.3 跟随矩阵  31-32
  3.2 上下文环境中参数  32-40
    3.2.1 时间参数  34-37
    3.2.2 人员参数  37-40
  3.3 本章小结  40-41
第4章 算法思想与步骤  41-51
  4.1 各类技术应用于探测概念漂移的介绍  41-44
  4.2 算法思想  44-47
  4.3 算法步骤  47-51
第5章 实验结果和结论  51-56
  5.1 实验一  51-54
  5.2 实验二  54-55
  5.3 本章小结  55-56
第6章 结论及展望  56-57
参考文献  57-60
致谢  60-61
攻读学位期间发表的学术论文  61-62
学位论文评闻及答辩情况表  62

相似论文

  1. 基于知识整合的数据流分类算法研究,TP311.13
  2. 云计算平台上的增量学习研究,TP311.13
  3. 医疗临床路径挖掘方法研究与应用,TP311.13
  4. 数据流在线分类算法的研究与实现,TP311.13
  5. 非自由选择结构挖掘算法的研究,TP311.13
  6. 基于流程挖掘的甄别正常与非正常案例的模型,TP311.13
  7. 基于事件日志挖掘的流程诊断系统研究,TP311.52
  8. 基于关键词的文本流分类技术研究,TP391.1
  9. 基于分类器集成技术的数据流分类研究,TP311.13
  10. 纠错输出编码算法的研究及其应用,TP311.13
  11. 基于数据流分类的在线网络入侵检测研究,TP393.08
  12. 保留上下文环境体绘制模型研究,TP391.41
  13. 基于流程挖掘的临床路径设计方法研究,R197.3
  14. 通用文档模型及在文档格式转换中的应用,TP391.1
  15. SSL在嵌入式浏览器中的设计与实现,TP311.52
  16. 大规模汉语语料库分词一致性检验技术研究,TP391.1
  17. 基于遗传方法的流程挖掘技术的研究,TP311.13
  18. 隐含概念漂移的数据流分类研究,TP181
  19. 基于窗口机制的概念漂移数据流分类算法研究,TP311.13
  20. 面向含噪数据流的概念漂移集成分类研究,TP311.13

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com