学位论文 > 优秀研究生学位论文题录展示

关联规则挖掘在交通事故成因分析中的应用

作 者: 王洪海
导 师: 郑诚
学 校: 安徽大学
专 业: 计算机应用技术
关键词: 数据挖掘 交通事故 关联规则 Apriori算法
分类号: U491.31
类 型: 硕士论文
年 份: 2011年
下 载: 141次
引 用: 0次
阅 读: 论文下载
 

内容摘要


进入21世纪,随着汽车保有量的增加,道路交通事故的频繁发生已日益成为一个严重的社会问题。当然,交通事故的成因是多方面的,在大量实际的道路交通安全事故属性中隐藏着某些潜在的规律,如果我们能够对这些数据进行科学地分析并挖掘出其内在的联系,那么相关部门在制定新的法律法规来改进交通安全现状做出决策时就有依可据了。交通事故也展现出多样性与复杂性,这就意味着,传统意义上的数据分析、数据处理工具、方式和方法已完全不能适应时代的要求。数据挖掘(DataMining)可以定义为:从海量的未知数据中提取或挖掘出知识,从技术层面上来说,关联规则是现阶段数据挖掘的最重要的方法。关联规则反映了事物之间的关联性和相互依存性[1],是指在数据集中支持度(Support)、置信度(Confidence)分别满足给定值(阈值)的规则。Apriori算法是关联规则挖掘的经典算法,该算法中蕴含的一条重要性质:“一个频繁项集的每一非空子集均应是频繁的”。通过专业的知识与技术,关联规则可以用来对数据进行分析,给出规则预测,从而找出它们之间内在的因果关系,而从海量的数据中寻找到数据间的关联关系对于决策分析是非常有价值的。采用数据挖掘手段可以从真实的交通事故案例数据库中搜索到有价值的信息,不断地组合影响交通事故案例诱因可以发现,这些因素之间存在着某种隐藏的规律。影响交通事故发生的因素一般是有联系的,如果通过人工调控,使这些关联因素中其中一些因素削弱或消失,则可以在一定程度上预防和减少交通事故的发生。由于道路交通安全事故诱发因素的复杂性,经典的数据挖掘Apriori算法并不适合对非单一维的规则挖掘,因此需要扩展。本文结合实际问题,对我们所研究的问题进行简化的同时设计了一套改进的Apriori算法,且支持多维度的关联规则挖掘,由于引入多维属性,因此挖掘出来的规则将更具有实用性和建议性。在多维度的数据库中对关联规则的挖掘将每个维当作一个谓词,可以更详细描述出一个事实。在挖掘所需信息时,需要在海量数据库中搜索频繁子集。在多层次多维度数据模型中,搜索频繁子集需要对每一层设定一个大小合适的最小支持度,因此在实际的操作中比较繁琐,因此可以绕个弯子来简化操作。方法是对规则进行分析之前我们先任选一个特定的层次作关联分析并排除其它层次的分析,因此这个问题就简化成了单层的规则分析。例如我们要对事故发生地点进行挖掘,选择县级公路层作为关联对象,其余的维度也这样选择。这样做问题就简化了,也得到了我们对多维度多层次的道路安全交通事故的数据挖掘的目的。本文作者针对道路交通事故这一社会性问题加以研究,对大家比较熟悉的单维单层Apriori算法加以改进;给出了交通事故常用属性的描述;道路交通事故属性的组织建模采取全星型连接数据模型;将大量纷繁芜杂的交通事故数据源组织为可进行挖掘的属性信息,以利于挖掘出它们之间各种复杂关系;我们着重描述了对真实交通事故数据的建模,并对研究对象设计改进的Apriori算法。最后我们在对数据库上的数据进行关联挖掘,导出影响道路交通安全事故因素关系的关联规则。本文对现实交通事故数据进行了合理的建模,并对这些数据进行关联规则挖掘,在理论和实际上都证明了关联规则挖掘在交通事故数据的分析和决策上具有使用价值。

全文目录


摘要  3-5
ABSTRACT  5-7
目录  7-9
第一章 绪论  9-14
  1.1 论文选题背景和目的  9-10
  1.2 国内外关于交通事故致因的研究状况  10-11
    1.2.1 国内研究状况  10-11
    1.2.2 国外研究状况  11
  1.3 相关工作介绍  11-13
    1.3.1 本文内容提要  11-12
    1.3.2 本文所做的工作如下  12-13
  1.4 文章结构  13-14
第二章 数据挖掘基础  14-17
  2.1 数据挖掘概述  14
    2.1.1 数据挖掘的基本概念  14
    2.1.2 数据挖掘方法  14
  2.2 数据挖掘的功能  14-15
  2.3 数据挖掘技术对于交通领域的重要意义  15-17
第三章 数据挖掘技术中关联规则理论  17-29
  3.1 关联规则  17-18
    3.1.1 形式化定义  17-18
    3.1.2 支持度(Support)  18
    3.1.3 置信度(Confidence)  18
  3.2 正负相关关联规则和强弱关联规则  18-19
  3.3 对关联规则进行分类以及对其进行抽取  19-20
  3.4 关联规则算法  20-21
  3.5 多视角关联规则  21-24
    3.5.1 简单的一层规则  21-22
    3.5.2 关联规则的多维挖掘方法  22-24
  3.6 Apriori算法的改进以扩充到多维模型中  24-28
  3.7 评价关联规则  28-29
第四章 交通安全事故中关联规则的数据挖掘建模  29-43
  4.1 造成交通事故成的因素分析  29-32
    4.1.1 交通事故的法律定义和种类  29
    4.1.2 诱发交通事故的因素论  29-31
    4.1.3 交通安全事故的诱发因素的研究方法  31-32
  4.2 多维(非单一谓词)数据的模型  32-36
  4.3 道路交通安全事故中诱发因素的形式化属性定义  36-38
  4.4 对道路交通安全事故诱发因素的数据模型  38-43
第五章 道路交通安全事故案例数据库中诱因的关联规则挖掘  43-61
  5.1 改进的Apriori算法  44-52
    5.1.1 数据集的采集与准备  44-49
    5.1.2 挖掘关联规则的主要步骤和方法  49-52
  5.2 实验分析  52-61
    5.2.1 使用Weka进行实验  52-57
    5.2.2 评价并优化道路交通安全事故的关联规则  57-58
    5.2.3 附加约束条件的改进算法  58-59
    5.2.4 结论  59-61
第六章 总结与展望  61-63
  6.1 总结  61-62
  6.2 展望  62-63
参考文献  63-67
致谢  67-68
攻读学位期间发表的学术论文  68

相似论文

  1. 基于数据挖掘技术的保健品营销研究,F426.72
  2. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  3. 基于变异粒子群的聚类算法研究,TP18
  4. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  5. 基于遗传算法和粗糙集的聚类算法研究,TP18
  6. 基于数据挖掘的税务稽查选案研究,F812.42
  7. 面向社区教育的个性化学习系统的研究与实现,TP391.6
  8. 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
  9. 交通事故之民事责任的ADR研究,D926
  10. 基于行业参数优化模型的投资项目决策支持系统,F283
  11. 机动车交通事故责任强制保险制度研究,D922.14
  12. 关联规则算法在高职院校贫困生认定工作中的应用,G717
  13. Web使用挖掘与网页个性化服务推荐研究,TP311.13
  14. 隐私保护线性规划和支持向量机新算法,O221.1
  15. 基于智能计算的网络学习评价模型研究与系统设计,TP18
  16. 基于数据挖掘技术的高校毕业生就业管理信息系统的设计与实现,TP311.52
  17. 面向电子商务的Web数据挖掘应用研究,TP311.13
  18. 选矿过程综合生产指标分解的补偿方法及应用,TP311.13
  19. 糖尿病营养膳食系统中的指标评价与研究,R587.2
  20. 数据挖掘技术在预防电信客户流失中的应用研究,TP311.13
  21. 基于支持向量机(SVM)理论的个人信用评估研究,TP18

中图分类: > 交通运输 > 公路运输 > 交通工程与公路运输技术管理 > 交通工程与交通管理 > 交通事故 > 交通事故处理、分析与统计
© 2012 www.xueweilunwen.com