学位论文 > 优秀研究生学位论文题录展示

基于CRISP-DM的流程可视化数据挖掘工具的研究与实现

作 者: 郭鑫
导 师: 成长生
学 校: 东华大学
专 业: 计算机软件与理论
关键词: CRISP-DM 流程可视化 过程模型 数据挖掘
分类号: TP311.13
类 型: 硕士论文
年 份: 2009年
下 载: 40次
引 用: 0次
阅 读: 论文下载
 

内容摘要


知识发现和数据挖掘已成为当今计算机领域的研究热点。如何从海量数据中获取到有用的信息和知识,挖掘出数据中隐含的未知规律,是人类迫切需要解决的问题。本文对数据挖掘工具的相关技术进行了研究,结合跨行业数据挖掘标准流程(cross industry standard process for data mining,CRISP-DM)过程模型流程可视化等技术,设计并实现了应用于轨道交通自动售检票(automatic farecollection,AFC)系统的数据挖掘工具。本文作者的主要研究工作如下:(1)对数据挖掘、过程模型和可视化数据挖掘技术进行了理论研究,详细分析了轨道交通AFC系统的数据和业务。(2)设计和实现了轨道交通AFC系统数据挖掘工具的三层体系结构(客户端层、服务器层和数据库层)及四级层次结构(数据驱动接口层、数据处理层、数据挖掘层和可视化显示层),提高海量数据处理性能。(3)研究了CRISP-DM的方法学。根据CRISP-DM过程模型的六个阶段(商业目标理解、数据理解、数据预处理、建立模型、验证模型和模型实施)和四个层次(阶段、一般任务、具体任务和过程实例),设计各阶段的任务和输出,利用数据挖掘上下文完成一般任务层与具体任务层之间的映射,实现过程模型的重用。(4)着重研究和实现了数据挖掘流程的可视化。将数据挖掘流图以有向图的方式表示和存储,使用节点表和连接线表分别存储流程图中所有节点和连接线,对数据流和命令流的交互及传递进行控制。详细描述了数据挖掘数据源的获取方法,以及数据挖掘流程的任务节点、控制节点、连接线和数据流图的设计。(5)对数据挖掘工具的可扩展性方法进行了研究。以一个实例展示了基于CRISP-DM的流程可视化数据挖掘工具的使用效果。实践表明,该数据挖掘工具操作界面灵活友好,使用其对轨道交通AFC系统的数据进行挖掘、分析和预测,能够提高运营管理决策水平、降低运维成本。

全文目录


摘要  5-6
Abstract  6-9
1 绪论  9-15
  1.1 引言  9
  1.2 项目背景  9-11
  1.3 国内外发展现状  11-12
  1.4 研究内容与创新点  12-13
  1.5 本文的组织结构  13-15
2 关键技术  15-26
  2.1 轨道交通AFC系统  15-19
  2.2 数据挖掘  19-21
  2.3 过程模型  21-23
  2.4 可视化数据挖掘  23-25
  2.5 本章小结  25-26
3 数据挖掘工具的构架与界面设计  26-33
  3.1 体系结构  26-27
  3.2 层次结构  27-30
  3.3 界面设计  30-31
  3.4 本章小结  31-33
4 CRISP-DM过程模型的实现  33-43
  4.1 CRISP-DM过程模型的四个层次  33-38
  4.2 CRISP-DM过程模型的六个阶段  38-42
  4.3 本章小结  42-43
5 数据挖掘流程可视化的设计与实现  43-55
  5.1 数据挖掘数据源  43-48
  5.2 数据挖掘流程节点和连接线  48-51
  5.3 数据挖掘流程图  51-52
  5.4 数据挖掘流程控制  52-53
  5.5 数据挖掘工具可扩展性  53
  5.6 本章小结  53-55
6 项目实施  55-66
  6.1 项目介绍  55
  6.2 开发平台与工具  55
  6.3 应用实例  55-64
  6.4 本章小结  64-66
7 总结与展望  66-68
  7.1 总结  66
  7.2 创新点  66-67
  7.3 展望  67-68
参考文献  68-72
攻读硕士学位期间的研究成果  72-73
致谢  73

相似论文

  1. 基于数据挖掘技术的保健品营销研究,F426.72
  2. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  3. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  4. 魔力平台业务过程建模冲突消解的研究与实现,TP311.5
  5. Bicluster数据分析软件设计与实现,TP311.52
  6. 基于变异粒子群的聚类算法研究,TP18
  7. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  8. 基于遗传算法和粗糙集的聚类算法研究,TP18
  9. 基于数据挖掘的税务稽查选案研究,F812.42
  10. 面向社区教育的个性化学习系统的研究与实现,TP391.6
  11. 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
  12. 数据仓库技术在银行客户管理系统中的研究和实现,TP315
  13. 基于Moodle的高职网络教学系统设计与实现,TP311.52
  14. 教学质量评估数据挖掘系统设计与开发,TP311.13
  15. 关联规则算法在高职院校贫困生认定工作中的应用,G717
  16. 基于数据挖掘技术在城市供水的分析与决策,F299.24;F224
  17. 数据挖掘技术在电视用户满意度分析中的应用研究,TP311.13
  18. Web使用挖掘与网页个性化服务推荐研究,TP311.13
  19. 数据挖掘在学校管理和学生培养中的应用,TP311.13
  20. 高校毕业生就业状况监测系统研究,G647.38
  21. 基于数据仓库的药品监管辅助决策支持系统的设计与实现,TP311.13

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com